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Prefácio 


Dizia Monteiro Lobato que um país se faz com homens e livros. Com essas 
palavras em mente, foi para mim um privilégio ter sido convidado para redi- 
gir o prefácio desta obra, redigida por dois colegas de destacada atuação na 
prática da Engenharia de Controle e na formação continuada de novos profis- 
sionais para o país. O texto é de agradável leitura, com riqueza de exemplos, 
ilustrações claras e exposição didática apoiada por rigor matemático. Notas 
históricas também são incluídas de forma muito oportuna. O conteúdo abarca 
o uso de modelos lineares e também diversas ferramentas para tratamento de 
não linearidades, percorrendo com elegância tanto o controle a tempo contínuo 
quanto o controle empregando amostragem. Também são discutidos vários as- 
pectos de relevância para um projeto de engenharia, desde as análises iniciais 
até o comissionamento. Nesse sentido, será de valia para profissionais e estu- 
dantes, de graduação e pós-graduação, nos diversos campos que se relacionam 
com esta transversal área de controle. Como um todo, trata-se de excelente 
livro, certamente uma valiosa contribuição para a literatura nacional. 


São José dos Campos, 15 de agosto de 2022 


Prof. Dr. Roberto Kawakami Harrop Galvão 


Apresentação 


Esta obra foi concebida com vistas a propiciar uma visão integrada do pro- 
blema de projeto de sistemas de controle, eficazes na prática e solidamente 
respaldada por princípios fundamentais. 


Busca-se apresentar primordialmente os variados enfoques amplamente utili- 
zados na prática rotineira de projeto de controladores, atentando-se, porém, 
a aspectos tecnológicos que permeiam o meio industrial e também sem negli- 
genciar o rigor formal. 


O texto inclui resultados relativamente modernos da área de Sistemas e Con- 
trole, tais como os esquemas de controle adaptativo e de controle robusto que 
são métodos usuais para mitigar incertezas, sem descuidar, no entanto, dos 
chamados clássicos. 


Um capítulo próprio foi preparado para prover uma visão holística de projeto 
de controladores seguindo preceitos da Engenharia de Sistemas. 


Em vista da atualidade, são cobertos alguns aspectos relativos a controle por 
computador, bem como de uso de sistemas baseados em conhecimento em pro- 
blemas de controle. 

A apresentação dos diversos métodos de análise e projeto requer apenas fer- 
ramentas estudados nos cursos básicos de Engenharia, ou seja, Cálculo Dife- 
rencial e Integral, Álgebra Linear e Funções de Variável Complexa. 

Uma porção significativa do material desse livro foi concebido e utilizado em 
um número de disciplinas da área de Sistemas e Controle do ITA e de outras 
Instituições. 
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Parte I 


Introdução 


Conceitos e definições 


“The important thing in Science is not so much to obtain new facts 
as to discover new ways of thinking about them. ” 
— William Lawrence Bragg 


O conceito de controle pode ser compreendido como um procedimento ou um 
mecanismo, dependendo do contexto, para tornar adequado o comportamento 
de uma entidade física natural ou artificial, de acordo com alguma funcionali- 
dade específica. 


Por exemplo, em humanos, o mecanismo de controle da pressão arterial atua 
sobre o fenômeno da circulação sanguínea para mantê-la em uma faixa ade- 
quada de valores. 

Um outro exemplo é o mecanismo de regulação da glicose plasmática envol- 
vendo a participação da insulina. 


O equilíbrio ecológico, no contexto de predador-presa, é também uma manifes- 
tação de regulação da população no âmbito de controle dos recursos disponíveis 
no habitat. 


Essa obra foca primordialmente os sistemas artificiais, concebidos e construí- 
dos por humanos. São inúmeros os exemplos de sistemas tecnológicos que 
utilizam o conceito de controle: regulação de temperatura de uma estufa, ma- 
nutenção do nível de água em um tanque de armazenamento, rastreamento de 
uma trajetória de um avião, ventilação pulmonar mecânica para oxigenação 
sanguínea, etc. 


1.1 Conceitos, definições e notação 


Nesta seção são apresentados os conceitos básicos para a compreensão dos 
métodos para a realização de projetos envolvendo controle, bem como algumas 
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definições e a notação utilizada neste texto. 


e Sistema é um conjunto de elementos interdependentes, concretos ou abs- 
tratos, que formam um todo organizado. Do ponto de vista prático, o 
sistema é a parte do universo que foi isolada para estudo. O sistema 


Universo 


Ruídos ou Perturbações Grandeza de Interesse 
w E 


Sistema 
u y 


Variáveis Manipuladas Grandezas Monitoradas 


Figura 1.1: Um sistema com as suas entradas e saídas. 


interage com o meio ambiente através de entradas e saídas. Em vista de 
este texto tratar de sistemas primordialmente tecnológicos, as entradas 
são as variáveis manipuladas u que são assumidas bem caracterizadas e 
w que são ruídos aleatórios ou perturbações indesejadas. As saídas de 
interesse são denotadas por z e as grandezas monitoradas (medidas) são 
representadas por y. Por exemplo, em um navio, pode-se manipular a 
posição do leme u, para se ajustar a direção de movimentação z, por sua 
vez indicada por uma bússola que fornece a leitura y, mas sofrendo per- 
turbações w devidas às ondas do mar. O conceito de sistema é arbitrário, 
de modo que, no contexto de tráfego urbano, o sistema compreende ruas, 
semáforos, veículos, pedestres etc. Mas um veículo, por exemplo, um au- 
tomóvel, é um sistema para efeito de estudo da suas características e as 
ruas, semáforos e pedestres constituem o meio ambiente. Por sua vez, 
no estudo de motores, os demais constituintes do automóvel, tais como 
a embreagem, a suspensão e a bateria, constituem o meio ambiente. 


e Modelo é uma representação das características essenciais de um sistema. 
São exemplos típicos a maquete para estudos arquitetônicos, os bonecos 
para a composição de pinturas e o camundongo para estudos farmacoló- 
gicos. Neste texto, por focar métodos quantitativos, os modelos são do 
tipo matemático. Especificações de desempenho são descrições formais 
do comportamento que se deseja que o sistema apresente. Por exemplo, 
se um forno deve apresentar uma temperatura adequada para assar um 
bolo, a especificação de desempenho poderia ser a regulação da tempe- 
ratura em 180º + 5º apesar de perturbações como a abertura frequente 
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da porta. 


e Muitas vezes é utilizado o termo automático quando se refere a sistemas 
de controle. Em princípio, automático é aquele que requer reduzida in- 
tervenção do operador humano, em contraposição ao termo manual. Por 
exemplo, um sistema de ar condicionado mantém regulada a temperatura 
do recinto, apesar de mudanças climáticas ou alterações do número de 
pessoas presentes na sala. Por outro lado, um ventilador simples requer 
que o usuário ajuste a velocidade (baixa, média, baixa) através de uma 
chave seletora. Com o advento de ferramentas de inteligência artificial 
e desenvolvimento de sistemas sofisticados de decisão, tem-se hoje em 
dia os sistemas autônomos que realizam tarefas complexas sem a interfe- 
rência direta do operador humano. Um exemplo clássico é o de veículos 
autônomos que dispõem de mecanismos de localização, planejamento de 
rotas, desvio de obstáculos imprevistos e pedestres. 


Genericamente, um problema de controle consiste de dois ingredientes prin- 
cipais: 
1. o sistema a ser controlado; e o 


2. o comportamento desejado a ser obtido mediante as ações de controle. 


Sistema Comportamento 
Físico Desejado 
(avião, estufa, circuito elétrico, (estável, preciso, rápido, seguro, 
coração artificial, caixa d'água) acurado, confiável, barato, simples) 
Modelo Especificação 
Matemático de Desempenho 
(equações diferenciais, equações (erro de regulação, erro de 


a diferenças, diagramas de estado) rastreamento, tempo de subida) 


Figura 1.2: Formulações qualitativa e quantitativa do problema de controle. 


A figura 1.2 mostra como os requisitos de natureza qualitativa podem ser 
transformados em especificações quantitativas no enfoque utilizado neste livro. 


Exemplos de sistemas de controle: 


e o ferro elétrico moderno é um sistema controlado e o comportamento 
desejado é que a sua temperatura seja mantida próxima a um valor 
ajustado a priori, mesmo quando se passam tecidos de diferentes tipos. 
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e o automóvel é um sistema controlado e o comportamento desejado é que 
o veículo chegue ao destino programado transportando os passageiros de 
modo seguro e eficiente. 


e o coração artificial é um sistema físico controlado e o comportamento de- 
sejado é que o fluxo sanguíneo seja ajustado de modo compatível com as 
necessidades do paciente e sem provocar efeitos colaterais como hemólise. 


e o gerador de energia elétrica acionado por um motor diesel, comum 
em alguns condomínios residenciais, é um sistema físico controlado e 
o comportamento desejado é que a eletricidade seja suprida com tensão 
e frequência em uma faixa adequada, apesar da variação da demanda. 


A importância de sistemas de controle é clara, tanto em sistemas naturais como 
os construídos artificialmente. Um exemplo de controle automático natural é 
a homeostasia, que é a capacidade dos organismos de manter em equilíbrio 
as suas funções, mesmo quando ocorrem mudanças no meio (regulação da 
frequência cardíaca, da quantidade de glicose plasmática e fluxo urinário, en- 
tre vários outros). 


Exemplo de sistemas tecnológicos são variados e propiciam várias funções rele- 
vantes à humanidade. Utilizando-se da teoria de controle automático, podem 
ser concebidos equipamentos que evitam a necessidade de operadores humanos 
em ambientes hostis, como aqueles em que há radiação ionizante, temperatu- 
ras elevadas, gases tóxicos e animais agressivos, entre outros. Os sistemas de 
controle automático podem substituir os humanos em tarefas árduas, como as 
que envolvem forças musculares grandes que podem ocasionar lesões, exigem 
ações repetitivas que podem levar à desatenção e acidentes, envolvem risco 
como o combate a incêndios etc. 


1.2 Um exemplo intuitivo de projeto 


Nesta seção é desenvolvido um controlador simples para um veículo propulsi- 
onado a uma hélice com velocidade de rotação ajustável, utilizando apenas o 
bom senso e alguns conhecimentos elementares de cálculo. 


A ideia é apresentar a sequência básica de etapas de um projeto simples de 
um sistema de controle. 
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Considere um veículo propulsionado por hé- 
lice, como visto na figura 1.3. O sistema fí- 
sico é o veículo e o comportamento desejado 
será a regulação da velocidade em um va- 
lor preestabelecido, apesar de incertezas tais 
como rajadas de vento, irregularidades no 
solo e outras perturbações. 


Necessita-se, inicialmente, obter um modelo 

matemático. As grandezas envolvidas no mo- Figura 1.3: Exemplo de sis- 
delo são a massa m, a força F devido à rota- tema translacional linear: veí- 
ção da hélice com velocidade angular U e o culo propulsionado a hélice. 


arrasto aerodinâmico D. 


Por simplicidade, não será incluído o efeito do atrito mecânico nos eixos das 
rodas. 


Nesse exemplo, o modelo matemático é obtido utilizando-se a lei de Newton, 


F=D=m (1.1) 


e, assumindo que as forças F e D podem ser aproximadas na condição de 
operação pretendida por 


F = aU? (1.2) 
2 
(=) (1.3) 


o modelo matemático que descreve o movimento do veículo é expresso por 


dX XY? 


Equações diferenciais ordinárias lineares são, em geral, fáceis de serem resol- 
vidas. Porém, como a equação diferencial 1.4 não é linear, propõe-se fazer 
uma aproximação linear em torno do ponto de operação para simplificar os 
cálculos. 


Adote-se como o comportamento desejado a ser apresentado pelo veículo a 
regulação da velocidade em valor constante de Vnom = x, através da mani- 
pulação da rotação em torno de U = Unom da hélice. 


Como a velocidade é, por definição, V = ax tem-se no ponto de operação 


2 a e 
Vnom que “o = Trom = 0 e a equação 1.4 permite escrever 
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2 
8 (5) = 0UZm (1.5) 


Vnom = DU ei (1.6) 
p 
Adicionando-se um pequeno sinal u a Unom (ou seja, |u| < |Unom|), o carrinho 
responde com uma alteração z(t) em relação a X(t) e, definindo v = de, a 
equação 1.4 pode ser reescrita como 


ou 


2 
ma (X +2) = a (Unom + 4)” — B (Vnom + v)? (1.7) 


2 


Notando que u? é um termo de segunda ordem, u? < Ulm + 2Unom u, e 


pode-se escrever 


(Unom + u)? = UŽom + 2Unom u + u? (1.8) 
Uoi + 2Unom U (1.9) 


Q 


Analogamente, faz-se a aproximação (Vnom + V) = V2m + 2Vnom V. 


nom, 


Substituindo-se essas expressões em 1.7, tem-se que 


d? dgx 
mAn +m = aê + 2aUnom u yee 20 Vom V (1.10) 


em que os cancelamentos ocorrem em vista de 1.4. 


Logo, o modelo linearizado do carrinho é 
dx 
ME = —2 B Vnom V + 2aU nom U (1.11) 


Lembrando que dg = w e adotando a notação agrupada 


a 2 (1.12) 
m 

p = 2a (Unom) (1.13) 
m 


obtém-se o modelo para a dinâmica da velocidade do veículo em função de 
pequenas alterações na velocidade de rotação da hélice, dado por 


dv 
— = 1.14 
q” + bu (1.14) 
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Para se manter a velocidade do veículo próximo ao valor nominal Vnom apesar 
de perturbações tais como rajadas de vento e irregularidades na pista, deseja- 
se projetar um controlador (regulador). 

Para produzir uma ação u, sempre que v Æ 0, uma proposta é adotar a estra- 
tégia representada por 


u = —K(Vaom —V) (1.15) 
= Kù (1.16) 


que corresponde a aumentar linearmente a rotação u da hélice quando a ve- 
locidade está abaixo do valor nominal, ou seja, v < 0, e diminuir no caso 
contrário. 

O valor v do veículo pode ser medido com o auxílio de um tacômetro acoplado 
a uma das rodas (supondo que não há derrapagem). 


Substituindo a expressão 1.16 em 1.14, resulta que 


a = w- Kv (1.17) 


= (a—K)v (1.18) 
para a qual se sabe que a solução é (basta substituir em 1.18) 
v(t) = e-*)ty(0) (1.19) 


A figura 1.4 apresenta uma simulação em que v(0) é o erro Vnom — V no 
instante t = O (quando o cronômetro foi disparado). 


Para ilustrar a vantagem da utilização da realimentação, injetou-se no instante 
t = 1.5s uma perturbação (representando, por exemplo, passagem por um 
desnível do solo). 


Simulando-se o sistema veículo + controlador utilizando o modelo não linear 
original, constata-se que a velocidade Vnom é recuperada após a perturbação. 


Tendo-se projetado o controlador, pode-se, ainda, fazer um estudo adicional 
sobre o efeito do ganho K no desempenho do sistema. 


Embora o erro tenda mais rapidamente a O quando o ganho K assume valores 
maiores, conforme indicado pela expressão 1.19 é importante ressaltar que 
o incremento na rotação da hélice u pode ser inconveniente, por exemplo, 
em vista do aumento do consumo de combustível ou de limitações como a 
saturação do motor que aciona a hélice. 

Um outro exemplo de um estudo suplementar poderia ser a análise do efeito 
de fenômenos aleatórios, tais como aqueles devidos às irregularidades no solo 
e turbulência do ar, fatores esses que afetam o conforto dos passageiros. 
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Regulador de Velocidade 


= 


Velocidade [m/s] 
co 


6| Perturbação 


1 2 3 4 5 6 7 8 9 10 
Tempo 


Figura 1.4: Exemplo de projeto de um controlador para regulação da veloci- 
dade em que o efeito de uma perturbação é rejeitada. 


Nota-se na 1.4 que, embora o carro responda à perturbação que foi aplicada, 
este retorna ao valor de referência pela ação do controlador. Neste contexto, 
diz-se que se tem um sistema automático de controle, ou seja, sem a intervenção 
de um operador humano. 


1.3 Público-alvo 


Esta obra busca explorar os conceitos e os métodos utilizados em aplicações 
práticas da teoria de controle, eventualmente expandindo o conteúdo visto em 
cursos tradicionais da área. 


Embora o domínio das noções básicas da teoria de controle facilite a leitura do 
presente texto, tomou-se o cuidado para limitar os pre-requisitos para uma boa 
compreensão do material a assuntos vistos, em geral, nos primeiros anos dos 
cursos de Ciências Exatas, tais como Cálculo Diferencial e Integral, Equações 
Diferenciais Ordinárias, Álgebra Linear e Cálculo em uma Variável Complexa. 
Noções de programação de computador são também muito úteis. 


O enfoque básico neste livro para abordar os problemas de controle é buscar 
um tratamento inicial com modelos simplificados (tipicamente modelos linea- 
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res e invariantes no tempo) e complementar, posteriormente, com mecanismos 
tais como escalonamento de ganhos, estruturas anti-windup, filtros condicio- 
nador de sinais, compensadores, ferramentas de inteligência artificial etc. 


Na apresentação de conceitos mais avançados, como controle adaptativo, con- 
trole robusto, estabilidade de sistemas não lineares e outros, buscou-se utilizar 
exemplos simples, porém com tratamento formal rigoroso, sempre que não 
extrapole o escopo do livro. Por exemplo, sabe-se que a solução da equação 
diferencial ordinária 4 = Ax a partir de x(0) dado é x(t) = e4* x(0). Assim, é 
fácil substituir essa expressão na equação diferencial e verificar que é, de fato, 
uma solução. Porém, um procedimento construtivo que permite obter essa 
solução de modo sistemático é deixado para o Apêndice. 


Embora seja recomendado que os exercícios sejam resolvidos preferencialmente 
à mão, podem ser usados recursos computacionais tais como MATLAB, Sci- 
Lab e Python Control Systems Library para conferir as soluções. Além disso, 
alguns exercícios possuem múltiplas soluções em função da escolha do método 
utilizado e dos parâmetros adotados, principalmente quando se trata de proje- 
tos. É interessante, nesses casos, fazer comparações entre os resultados obtidos 
com diferentes métodos e buscar compreender os fenômenos envolvidos. 


1.4 Exercícios 


1.4.1 Exercício 


Cite 10 sistemas de controle que estão presentes no âmbito domiciliar (por 
exemplo, controle de temperatura do forno elétrico, velocidade de rotação do 
seu toca-discos, regulador de tensão do no-break, dimmer etc.) 


1.4.2 Exercício 


Cite 10 sistemas de controle que estão presentes no âmbito social (por exem- 
plo, pesca não predatória, plano de previdência social, dinâmica populacional, 
controle de tráfego urbano, controle do câmbio etc.) 


1.4.3 Exercício 


Escolha um sistema industrial com o qual está familiarizado e proponha que 
variáveis seriam interessantes como entradas, como saídas e quais são as po- 
tenciais perturbações. Procure estabelecer alguns comportamentos que seriam 
buscados desse sistema, mediante ações de controle. 
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Panorama histórico 


Com o intuito de contextualizar a importância dos sistemas de controle, bem 
como para proporcionar uma visão macroscópica de como ocorreu o seu de- 
senvolvimento, apresenta-se aqui uma linha de tempo simplificada. 


São destacados alguns dos eventos marcantes na história da ciência e da tec- 
nologia, bem como as suas consequências. 

Por exemplo, o advento da máquina a vapor de James Watt é um evento 
marcante que promoveu uma série de avanços científicos, tecnológicos, sociais, 
econômicos e culturais. Mesmo considerando apenas uma aplicação da má- 
quina a vapor, mais especificamente o transporte ferroviário, as implicações 
foram globais em termos de geopolítica, economia e adaptações culturais. 

O desenvolvimento de sistemas de novas tecnologias, incluindo os sistemas de 
controle, está fortemente ancorado na necessidade de buscar soluções para os 
vários problemas da sociedade (demand pull). Por outro lado, a curiosidade e 
a busca de maior conhecimento da natureza também impulsionam as realiza- 
ções científico-tecnológicas (science push). Em verdade, os dois movimentos 
demand pull e science push interagem entre si e, por exemplo, a demanda por 
um bom manejo do fornecimento de água à população levou ao desenvolvi- 
mento de novos sistemas de bombeamento, purificação, distribuição, incluindo 
sistemas de controle. Por outro lado, os trabalhos para o problema da água 
levou à concepção de bombas mais eficientes, medidores de vazão mais preci- 
sos, métodos de purificação mais baratos e muitas outras inovações utilizáveis 
em uma variedade de aplicações. 

Assim, de um lado os sistemas de controle foram fruto da necessidade de ob- 
ter soluções específicas de certos problemas. Por outro lado, os avanços nos 
conhecimentos sobre sistemas de controle têm proporcionado a concepção de 
novos produtos inovadores. 


As principais fontes de informações contidas nesta seção são: 
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1. A coleção de livros editados por David C. Lindberg e Ronald L. Numbers, 
Cambridge History of Science, 8 volumes, Cambridge University Press, 
2013. 


2. Coleções dos artigos seminais incluídos em (MAYR, 1970), (THALER, 
1974) e (BASAR, 2001). 


3. Os livros do Prof. Stuart Bennett. A história da Teoria de Controle 
entre 1.800 e 1930 é apresentada em (BENNETT, 1979). A evolução 
entre 1930 a 1955 é tratada em (BENNETT, 1993). 


4. A obra editada por Luiz Antonio Aguirre, Enciclopédia de Automática: 
Controle e Automação, 3 volumes, Editora Blücher, 2007, e também 
William S. Levine, The Control Handbook, CRC Press Handbook /TEEE 
Press, 1996. 


5. Quanto às biografias, os dados foram obtidos através de buscas na In- 
ternet. 


Dispositivos antigos 


Os dispositivos antigos eram construídos, em geral, de modo artístico e arte- 
sanal, baseado na capacidade inventiva de quem os concebeu. Um exemplo 
clássico é o Sistema Automático de Abertura de Portas atribuído ao matemá- 
tico Heron de Alexandria (c.10-c.70 AD). Consistia de um vaso de pressão, 
conectado ao altar da chama. Quando se acendia a chama, a variação de 
pressão devido à queima movimentava água de um compartimento a outro, de 
modo a obter uma tração mecânica para abrir o portão. Por curiosidade, em 
1931, Horace H. Raymond e Sheldon S. Roby projetaram e obtiveram uma 
patente de uma porta automática (Apparatus for Operating Doors, 23 out 
1934, n. US1978093A). Essa porta foi instalada em um restaurante de West 
Haven para facilitar os garçons no atendimento aos clientes. Hoje em dia, as 
portas automáticas são largamente difundidas. 


Observação: Atribui-se a Heron a invenção do aeolipile, que, em princípio, 
poderia ser considerado como uma turbina a vapor ou máquina a vapor. A 
invenção de máquinas a vapor constitui um importante marco na história da 
teoria de controle, mas que se tornou efetivo no século XVIII. Esse detalhe 
ilustra a dificuldade de se organizar uma linha de tempo. 
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Regulação de temperatura 


O termostato bimetálico, utilizado ainda nos dias de 

hoje, foi inventado em 1830 por Andrew Ure (1778- na 
1857). Consiste de duas lâminas de metal com co- f 
eficientes de dilatação diferentes coladas. Quando a 
temperatura aumenta, a dilatação maior de uma das K 

lâminas faz o conjunto envergar e esse movimento a 
pode ser utilizado, por exemplo, para ligar ou des- 
ligar o circuito de aquecimento. Em 1609, Cornelis 
Jacobszoon Drebbel (1572-1633) concebeu uma in- 
cubadora de ovos com termostato baseado na dila- Figura 2.1: Ex- 
tação do mercúrio para regular a temperatura. A traído da — wikipe- 
estratégia de controle liga-desliga é encontrada em dia.org/wiki/Acolipile. 
um grande número de aplicações, sendo que termos- 

tatos bimetálicos continuam ainda em uso, apesar de chaves mais modernas 
baseadas em relés e componentes semicondutores. 


Atualmente, o controle de temperatura está presente na estufa, no fogão, no 
ar-condicionado, no ferro elétrico, na geladeira, no arrefecimento de moto- 
res de carros, no cooler de microprocessadores e muitos outros dispositivos e 
equipamentos. 


Fontes de energia 


Para se atuar sobre um sistema físico para 
que esse apresente o comportamento desejado, 
necessita-se de fontes de energia. Antes do 
advento de máquinas a vapor, a energia me- 
cânica para bombeamento de água e moenda 
de grãos, por exemplo, era obtida através de 
cataventos e rodas d'água. Mecanismos enge- 
nhosos como a hélice de Edmund Lee (1745) 
permitiam que os cataventos ficassem alinha- 
dos com a direção do vento. 


Máquina a Vapor. Ex- 
traído de www.deutsches- 


.d hibiti i 
Thomas Newcomen (1664-1729) projetou, em da e |S REID EIGNS/ 


1712, a primeira máquina prática que quei- 

mava combustível para produzir movimento mecânico utilizado no aciona- 
mento de bombas hidráulicas (cilindro-pistão), melhorando o projeto idea- 
lizado por Thomas Savery (c.1650-1715). As bombas eram utilizadas para 
drenagem de minas. 


Denis Papin (1647-1713) inventou em 1681 um mecanismo de segurança para 
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regulação de pressão em máquinas a vapor. 
James Brindley (1716- 1772) patenteou em 1758 um sistema de boia e válvula 
para regular o nível de água em caldeiras a vapor. 


James Watt (1736-1819) inventa em 1769 uma máquina a vapor automatizada, 
mais eficiente que a máquina de Newcomen, cujas válvulas eram controladas 
manualmente. Além de utilização para bombeamento de água, inventou me- 
canismos para obter movimentos rotativos de eixos. Em 1788 Watt completa 
o desenvolvimento do mecanismo de regulação de velocidade de rotação de 
máquinas a vapor utilizando esferas suspensas por haste e submetidas a força 
centrífuga. O problema de hunting (oscilações na velocidade de rotação) levou 
ao desenvolvimento da teoria de estabilidade de Maxwell. 


A invenção de máquinas a vapor contribuiu significativamente para a Revolu- 
ção Industrial (meados do século XVIII a meados do XIX), em um processo 
que levou à substituição de artesão por máquinas, a produção doméstica por 
estabelecimentos fabris e a lenha por cavão. 


A Revolução Industrial impulsionou o desenvolvimento tecnológico e trans- 
formou o estilo de vida da humanidade. Um exemplo notável no campo da 
automação é o Tear de Jacquard, inventado em 1801 por Joseph Marie Jac- 
quard (1752-1834). Um outro exemplo é o desenvolvimento de estradas de 
ferro. A construção (1804) da primeira locomotiva empregando uma máquina 
a vapor é atribuída a Richard Trevithick (1771-1833). 


Medida do tempo 


A medida do tempo é de grande importância no con- 
trole do plantio e da colheita, na navegação marítima, 

no monitoramento de processos químicos, no estudo da a 
evolução clínica de doenças, no controle de processos cu- 
linários e muitas outras atividades. 


Acredita-se que um dos primeiros relógios era solar base- | | 


ado no movimento da sombra de algum obelisco ou uma 
haste, ao longo do dia. bóia 


A medida de intervalos maiores de tempo era baseadas 
em mapas estrelares. Por exemplo, no Brasil, vê-se a 
constelação de Órion no verão e a de Escorpião no in- 
verno. Os relógios de água (clepsydras) apareceram em 


água 


torno de 1.500 BC e relacionavam o tempo decorrido com 

o nível de água de um vaso em que se despejava água a Figura 2.2: Clepsi- 
um fluxo constante. As ampulhetas forneciam uma me- dra. 

dida do tempo baseado na passagem de areia de um compartimento a outro, 
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devido à ação da gravidade. 


Gerbert de Aurillac (c.946-1003), Papa Sylvester II, é creditado como o inven- 
tor do primeiro relógio totalmente mecânico em 996. 


Em torno de 1500, Peter Henlein (1485-1542) construiu os primeiros relógios 
pequenos e portáteis de bronze e usando mecanismos de mola. Em geral eram 
relógios ornamentais usados pela alta sociedade e alguns eram pomandros 
(porta perfumes, do francês, pomme d’ambre, maçã de âmbar). 


Christiaan Huygens (1629-1695) constrói, em 1656, um relógio preciso baseado 
no período de oscilação de um pêndulo. 


O relojoeiro William Clement (1657-1709) melhorou significativamente o fun- 
cionamento dos relógios introduzindo o mecanismo de escape (ou âncora de 
escape). 

Em 1927 o primeiro relógio baseado em oscilações do cristal de quartzo foi 
construído por W.A. Marrison e J. W. Horton no Laboratório da Bell Te- 
lephone (detalhes em Marrison, W.A. The Crystal Clock, Proc. Nat. Acad. 
Sci. USA, v. 16, n. 7, 1930 pp. 496-507). 

O primeiro relógio atômico, baseado em caesium-133, foi construído por Louis 
Essen em 1955 no National Physical Laboratory (Reino Unido), alcançando 
precisões da ordem de +1079 s/dia. 


Avanços da Matemática 


No enfoque quantitativo da Teoria de Controle, a Matemática desempenha um 
papel primordial. 

Aqui são mencionados apenas três exemplos de 
ferramentas amplamente utilizadas nos projetos de 
controladores para ilustrar a importância da mate- 
mática: 


e funções de transferência 


e equação de Euler-Lagrange 


e critérios para verificação de estabilidade 


Figura 2.3: Governador 
de Watt. Obtido de wi- 
kipedia.org. 


Como será visto à frente, um conceito muito 
importante na Teoria de Controle é o de Função 
de Transferência, formalizado por Thomas John 
Anson Bromwich (1875-1929) a partir do cál- 
culo operacional de Oliver Heaviside (1850-1925), 
utilizando a transformada de Laplace (Bronwich, 
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T.J.TA., Normal Coordinates in Dynamical Systems, Proc. London Math. 
Soc, 1917). 

A equação de Euler-Lagrange apresentada é uma poderosa ferramenta para 
a modelagem de sistemas que se deve a Leonhard Paul Euler (1707-1783) e 
Joseph Louis Lagrange (Giuseppe Lodovico Lagrangia, 1736-1813). A equação 
de Euler-Lagrange permite a obtenção de equações diferenciais que descrevem 
o comportamento físico de sistemas com base no princípio da estacionaridade 
da ação de William Rowan Hamilton (1805-1865). 


A garantia de estabilidade é um dos principais desafios encontrados no projeto 
de sistemas de controle. 


Em 1840, o astrônomo Sir George Biddell Airy (1801-1892) desenvolveu um 
mecanismo para apontar o seu telescópio para objeto celestes de modo a com- 
pensar automaticamente a rotação da Terra. Foi constatado por Airy que um 
projeto inadequado da lei de controle utilizado para apontar o telescópio re- 
sultava em oscilações sustentadas. Ao estudar esse fenômeno, Airy se tornou 
um dos primeiros cientistas a discutir o fenômeno de oscilações. 


Em 1868, James Clerk Maxwell (1831-1879) apresentou um artigo com uma 
análise matemática rigorosa da estabilidade de um sistema de controle re- 
alimentado, utilizado para manter regulada a velocidade de rotação de uma 
máquina a vapor, usando esferas que se deslocavam com a força centrífuga. Tal 
mecanismo foi chamado, na época, de governors (Maxwell, J.C. On Governors, 
Proceedings of the Royal Society of London, 1867-1868, v.16, pp. 270-283. 


Em 1876, Ivan Alekseyevich Vyshnegradskii (1832-1895) também logrou obter, 
independentemente de Maxwell, um critério de estabilidade para governadores 
utilizados em máquinas a vapor (Vishnegradskii, I.A. On controllers of direct 
action (em russo). Izvestiya St. Petersburg Technological Inst., v. 1, 1877 pp. 
21-62. 


Em 12 de setembro de 1892, Aleksandr Mikhailovich Lyapunov (1857-1918) 
defendeu a sua tese de doutorado The general problem of the stability of mo- 
tion junto à Universidade de Kharkov e publicado inicialmente pela Kharkov 
Mathematical Society. A tese foi traduzida para o francés, Davaux, E. Pro- 
blême général de la stabilité du mouvement (Annales de la Faculté des Sciences 
de Toulouse, v.2, n.9, 1907, pp. 203-474 e para o inglés (a partir do texto em 
francés), Fuller, A.T. The general problem of the stability of motion. Int. J. 
Control, v. 55, n.3, 1992, pp. 531-773. 


Eletricidade 


Ányos István Jedlik (1800-1895) é considerado o inventor de motores DC e em 
1827, construiu o que ele chamou de auto-rotor eletromagnético. Um motor 
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realmente operacional foi construído por Moritz Hermann (ou Boris Semyo- 
novich von Jacobi, 1801-1874) em 1834. O hoje em dia onipresente motor 
de indução com gaiola de esquilo foi inventado por Mikhail Osipovich Dolivo- 
Dobrovolsky (1861-1919) em 1889. 


Thomas Alva Edison (1847-1931) era um inventor e empresário. Entre as 
suas contribuições estão o sistema de energia elétrica, fonógrafo, lâmpada. elé- 
trica, filmadora (Kinetograph), bateria etc. Charles Proteus Steinmetz ([Karl 
August Rudolph Steinmetz, 1865-1923) era um matemático e engenheiro ele- 
tricista que fomentou o uso de AC que permitiu a expansão da indústria de 
energia elétrica nos EUA. 


Antes do advento da energia elétrica, a transmissão de energia era um grande 
problema. No início da revolução industrial utilizavam-se polias e correias 
para a distribuição de energia. 


Em 1938, Otto Hahn (1879-1968) e Fritz Straß- 
mann (1902-1980) descobriram o fenômeno da fissão 
nuclear. Logo depois, em 1942, a equipe liderada 
por Enrico Fermi construiu, em Chicago, o reator 
nuclear Chicago Pile-1. Iniciava-se então a era nu- 
clear, com grandes potenciais de geração de energia 
elétrica, além de produção de radioisótopos para tra- 
tamento médico, artefatos bélicos e propulsão de na- Figura 2.4: Jedlik's 
vios, entre outras aplicações. Porém, acidentes como “electromagnetic self- 
os de Three Mile Island, Chernobil e Fukushima têm rotor”, 1828, Museu 
sensibilizado a população em termos de segurança. de Artes Aplicadas, 


Budapeste. 
A menos do problema de descarte do combustível ra- 


dioativo exaurido, usinas nucleares são consideradas 

limpas em termos de emissão de gases que provocam o efeito estufa. Outras 
modalidades de geração de energia elétrica limpa são a hidroelétrica, fotovol- 
taica e eólica. 


Observação: Embora a transmissão de energia elétrica seja hegemônica, par- 
ticularmente quando se envolvem distâncias longas, é interessante notar que 
o calor de vaporização da água é 2.27 MJ/kg. Sem contar o calor devido ao 
superaquecimento do vapor, um fluxo de 1kg/s transporta 2.27 MJ/s, corres- 
pondendo à potência de 2.270.000 W, razão pela qual ainda se utilizam muitas 
caldeiras. Por exemplo, uma caldeira de 15 ton/h = 15.000/;kg/3.600s = 
4.2 kg/s. 
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Motor de combustão interna 


O primeiro motor de combustão interna que atingiu sucesso comercial foi 
aquele desenvolvido por Jean Joseph Etienne Lenoir (1822-1900) em 1858, 
embora já existissem outros projetos, como o de François Isaac de Rivaz (1752- 
1828), baseado em hidrogênio. O primeiro motor de quatro tempos e utilizando 
combustível líquido foi desenvolvido por Nikolaus August Otto (1832-1891) em 
1876. 

O ferro, o carvão e a energia a vapor são icôni- 
cos da primeira revolução industrial, do século 
XVIII a meados de XIX. A segunda revolução 
industrial, de meados do século XIX a meados 
do século XX, pode ser caracterizada pela in- 
tensa utilização do aço, da eletricidade e do pe- 
tróleo (caldeiras e motores) em um sem número 
de novas aplicações e produtos, incluindo o trans- 
porte em massa e desenvolvimento de aeroplanos. 


O processo desenvolvido em 1856 por Sir 
Henry Bessemer FRS (1813-1898) para reduzir 
o teor de carbono de ferro gusa fundido ha- 
via tornado eficaz a produção barata de aço. 


Figura 2.5: Arnott’s fac- 
tory at North Strathfi- 
eld, Sydney, in the 1920s 
MAAS Collection, Photo: 
Milton Kent. 


São características da época a produção em 
massa, estabelecimento de padrões, dissemina- 
ção do conceito de peças de reposição e métodos 
de linha de produção, introduzido em 1913 por 
Henry Ford (1863-1947) para a produção do au- 
tomóvel Model T. 


Aplicações navais 


Os desafios trazidos pela indústria naval contribuíram significativamente para 
o desenvolvimento da Teoria de Controle. Cornelis Jacobszoon Drebbel (1572- 
1633) já havia projetado, em torno de 1620, o que é considerado o primeiro 
submarino do mundo. 


Jean Joseph Léon Farcot (1824-1908) é considerado um dos pioneiros no pro- 
jeto de servomecanismos, tendo desenvolvido mecanismos para movimentar 
lemes de navio de várias toneladas a partir do comando do timoneiro. (Far- 
cot, J.J.L. Le servo-moteur ou Moteur Asservi, J. Baudry, 1873). 
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Em 1866 Robert Whitehead inventou o primeiro torpedo autopropulsionado 
utilizando ar comprimido e iniciou a primeira fábrica desse tipo de artefato. 
Em 1890 os torpedos foram dotados de giroscópio para melhorar o seu con- 
trole direcional. Em 1877, Louis Brennan patenteou um sistema para regular 
a profundidade de navegação do torpedo em 12 pés. 


Nikolai (Nicolas) Fyodorovich Minorsky (1885-1970) introduziu o controlador 
de 3 termos para posicionar lemes de navios, sendo considerado o inventor do 
controle PID (Proporcional, Integral e Derivativo). Minorsky, N. Directional 
stability of automatically steered bodies. Journal of the American Society of 
Naval Engineers, v.42, n.2, 1922, pp. 280-309. 


O termo servomecanismo foi popularizado por Harold Locke Hazen (1901- 
1980) através da publicação: Hazen, H. L. Theory of servomechanisms. J. 
Franklin Institute, v. 218, 1934, pp.209-331. Notar, porém, que em 1873 Jean 
Joseph Léon Farcot (1824-1908) havia publicado o livro Le Servo-Moteur. Far- 
cot era engenheiro e empresário e concebeu servomecanismos para movimentar 
pesados lemes de navios. (Farcot, J. Le servo-moteur: ou, moteur-asservi, ses 
principes constitutifs - variantes diverses application à la manoeuvre des gou- 
vernails. J. Baudry, 1873. Reimpressão Forgotten Books, 2018). 


Aeronáutica 


Em 8 de agosto de 1709, o balão de ar quente construído por Bartolomeu de 
Gusmão, alçou na corte de Dom João V de Portugal, em Lisboa. 


Em 24 de setembro de 1852, Baptiste Jules Henri Jacques Giffard (1825-1882) 
voou 27 km entre Paris e Elancourt no seu dirigível propelido por uma máquina 
a vapor. 

Júlio César Ribeiro de Souza 
(1843-1887) concebeu o dirigível Le 
Victoria (homenagem à esposa, Vic- 
toria Hippolita do Valle), que pos- 
suía um formato dissimétrico favorá- 
vel para avançar contra o vento. 

Em 1890, Clément Ader (1841- 
1925), construiu Eole, um averoplano 
equipado com um motor a vapor. 
Ader conseguiu decolar, mas não 
conseguiu controlar a Eole. 


Alberto Santos Dumont (1873-1932), Pigura 210; WOR do panes pn 
no seu dirigível No. 5, ganhou o prê- no seu l4-bis. Extraído de wikipe- 


mio Deutsch de la Meurthe do Aero dia.org/wiki /Voo-do 14. bis.jpg. 
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Clube da França por ter voado de 
Saint-Cloud ao Torre Eiffel Tower e retornado em 30 minutos. 


Em 17 de dezembro de 1903, os irmãos Orville (1871-1948) e Wilbur (1867- 
1912) conseguiram voar, de modo controlado, por 6 km em uma área de Kitty 
Hawk, North Carolina, após ser lançado por uma catapulta. O Wright Flyer 
possuía um mecanismo de controle em 3 eixos. 


Em 23 de outubro de 1906, Alberto Santos-Dumont (1873-1932) decolou e 
pousou com sucesso o seu aeroplano 14-bis, voando por 60m a uma altura de 
5m no Chateau de Bagatelle, Bois de Boulogne, Paris, ganhando o prêmio 
Deutsch-Archdeacon. 


A estabilidade é um tema de extrema relevância em aeronáutica e, em 1911, 
George Hartley Bryan (1864-1928) publicou um livro abrangendo esse tema 
(Bryan, G.H. Stability in Aviation: an Introduction to Dynamical Stability as 
Applied to the Motions of Aroplanes. Macmillan, London, 1911. 


Entre 1952 e 1956, Heinrich Focke (1890-1979) foi contratado pelo Centro 
Técnico Aeroespacial (CTA), onde desenvolveu, em 1951, o aeroplano de de- 
colagem vertical chamado de Convertiplano e, em 1956, o Helicóptero BF-1 
batizado de Beija-Flor. 


A Turbina a Jato foi inventada por Sir Frank Whittle (1907-1996) e por Hans 
J. P. von Ohain (1911-1998). O primeiro aeroplano a jato foi o He 178, que 
voou em 1939 com uma turbina von Ohain produzindo 4.9 kN de empuxo. 


O Laboratório de Radiação (Radiation Laboratory) foi construído no cam- 
pus do Massachusetts Institute of Technology (MIT), em 1940, para resolver 
problemas de processamento de sinais e controle relacionado com o o posicio- 
namento de canhões e processamento de dados de Radar. 


Um grande número de resultados importantes relacionados com métodos no 
domínio da frequência foi desenvolvido nesse laboratório, como descrito em 
James, Nichols, and Phillips. Theory of Servomechanisms, 1947. 


Enquanto trabalhava no projeto cooperativo MIT/Corporação Sperry, em 
1941, Albert C. Hall (1914-1992) percebeu a importância dos efeitos deletérios 
do ruído em sistemas de controle e de processamento de sinais. Utilizando 
técnicas no domínio da frequência, Hall projetou um efetivo sistema de radar. 


Em 1911, Elmer Ambrose Sperry (1860-1930), fundou a Sperry Gyroscope 
Company. Ainda durante a Primeira Guerra Mundial, a Sperry Gyroscope 
Company desenvolveu o primeiro sistema de controle de navios, denominado 
de Metal Mike. Os esforços militares impulsionaram significativos desenvolvi- 
mento em uma miríade de áreas estratégicas, incluindo a Teoria de Controle. 
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Foguetes e satélites 


Em 1960, Charles Stark “Doc” Draper (2 de outubro de 1901-25 de julho 
de 1987) inventou o sistema de navegação inercial utilizando giroscópios e 
acelerômetros, muito utilizados ainda hoje em navegação, apesar do advento 
de dispositivos como giro-LASER, GPS e outras invenções modernas. Em 
1953, Draper e sua equipe puderam testar o sistema de navegação inercial 
Space Inertial Reference Equiment (SPIRE) em um bombardeiro B-29. 
Assume-se que o foguete foi inventado por volta de 
1000 DC, na forma de flechas propulsionados por pól- 
vora. Em torno de 1405 DC, Konrad Kyeser (1366-?) 
escreveu o livro Bellifortis, sobre a tecnologia mili- 
tar, e incluiu descrições de foguetes. 


Várias variantes de foguetes e pirotécnicos foram 
descritas em Artis Magnae Artilleriae pars prima 
(Grande arte de artilharia, parte 1), de Kazimierz 
Siemienowicz (c. 1600-c. 1651), impresso em Ams- 
terdam em 1650. 


Em 16 de março de 1926 foi lançado o primeiro fo- 

guete de combustível líquido projetado por Robert Figura 2.7: Satélite 
Hutchings Goddard (1882-1945). In 1943, iniciou-se Sputnik 1, obtido de 
a produção do famoso foguete V-2 (Vergeltungswaffe wikipedia.org /wiki. 

2 ou arma de vingança 2) pela equipe coordenada 

por Wernher Magnus Maximilian Freiherr von Braun 

(1912-1977), que permitia atingir alvos a 300 km carregando 1.000 kg de ex- 
plosivos. 


O primeiro satélite artificial, o Sputnik 1, foi lançado do cosmódromo de Bai- 
konur no Cazaquistão, pela União Soviética, em 4 de outubro de 1957. Era 
uma esfera de 58 cm de diâmetro e 83.6 kg de massa. 


Em 12 de abril de 1961 foi lançado o Vostok I, levando o cosmonauta Yuri 
Alekseyevich Gagarin (1934-1968) para um voo orbital de 48 min ao redor da 
Terra. 


No Natal de 1968, Frank Frederick Borman II (1928-), James Arthur Lovell 
Jr. (1928-) e William Alison Anders (1933-) circum-navegaram a Lua a bordo 
do Apollo 8. Em 20 de julho de 1969, Neil Alden Armstrong (1930-2012) pisou 
no solo lunar, durante a missão do Apollo 11, cunhando a famosa frase: “Um 
pequeno passo para um homem, um salto gigantesco para a humanidade”. 


O primeiro astronauta brasileiro é Marcos Cesar Pontes (1963-), que partiu 
para a Estação Espacial Internacional (ISS) em 30 de março de 2006, a bordo 
da nave russa Soyuz TMA-8, e retornou no dia 8 de abril, a bordo da nave 
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Soyuz TMA-7. 


Eletrônica 


Os engenheiros que trabalham hoje em dia com Sistemas de Controle estão 
familiarizados com notações tais como 1 mH, 5 Q, 2 A, 5 V, 3 C, 10 uF, 100 
Hz, 3 G, 7 Oe e 9 Wb, relacionados com alguns dos precursores de eletricidade 
e magnetismo (Henry, Ohm, Ampére, Volta, Coulomb, Faraday, Hertz, Gauss, 
Oersted e Weber, respectivamente). 


Em 1799, Alessandro Giuseppe Antonio Anastasio Volta (1745-1827) demons- 
tra a sua bateria (pilha de discos intercalados de zinco, cobre e água salgada). 
Hoje em dia baterias empregando outros compostos são usadas em pilhas mais 
compactas e eficientes. 

Em 1845, Gustav Robert Kirchhoff (1824-1887) for- 
mulou as conhecidas leis que levam o seu nome quando 
ainda era estudante na Universidade de Königsberg. 


Em 1906, Lee de Forest (26 de agosto de 1873-30 de 
junho de 1961) concebe “Audion”, que é uma válvula 
termoiônica tipo triodo. Com o advento da válvula 
termoiônica a eletrônica tem uma rápida expansão em 
termos de novos produtos, incluindo equipamentos de 
áudio e de rádio. 


No campo de receptores de rádio, em 1914, Edwin 
Howard Armstrong (1890/2]-1954) solicitou uma pa- 
tente sobre circuitos regenerativos (ou seja, com reali- 
mentação negativa), concedida em 1906 (Wireless Re- Figura 2.8: Válvula 
ceiving System, n. US 11131494). Em 1931, Armstrong Termoiônica Audion, 
obteve a patente do sistema receptor superheterodino, obtido de wikipe- 
Radio Signaling System, n. US 19410664. Em 1933, dia.org/wiki/Audion. 
recebeu também a patente do FM de banda larga. 


Telecomunicações 


A era dos semicondutores inicia-se em 1947 com os trabalhos de William Brad- 
ford Shockley (1910-1989), John Bardeen (1908-1991) e Walter Houser Brat- 
tain (1902-1987), que desenvolveram o primeiro transistor efetivo nas depen- 
dência dos laboratórios Bell. Julius Edgar Lilienfeld (1882-1963) depositou 
uma solicitação de patente de um transistor de efeito de campo (FET) em 
1925, no Canadá, mas um dispositivo operacional ainda não havia sido apre- 
sentado. 


Em 1971, a Intel introduziu o primeiro microprocessador comercial, 4004 de 
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4 bits, desenvolvido por Federico Faggin (1941-), Marcian Edward “Ted” Hoff 
Jr. (1937-), Stanley Mazor (1941-) e Masatoshi Shima (1943-). 


A transmissão, recepção, armazenamento, recuperação, processamento e pro- 
teção de informações é muito relevante no projeto de controladores. Um exem- 
plo óbvio é o controle remoto, mas, mesmo para um sistema simples de con- 
trole, o sensor deve “comunicar” com o módulo de controle de modo a ter 
pouca distorção, sofrer pouca interferência de ruídos, ter velocidade adequada 
de transmissão etc. 


Em 1876, Alexander Graham Bell (1847-1922) obteve a patente do telefone. 
Porém, em 11 de junho de 2002, o Congresso dos Estados Unidos, através da 
resolução Nº. 269, reconheceu Antonio Santi Giuseppe Meucci (1808-1889) 
como o verdadeiro inventor, uma vez que Meucci havia vendido o protótipo 
a Bell por volta de 1870. Em 1875, registrou a patente de um telégrafo. 
Em 1837, Sir William Fothergill Cooke (1806-1879) e 
Charles Wheatstone (1802-1875) obtiveram uma pa- 
tente conjunta, após uma acirrada disputa sobre a pri- 
mazia da invenção do telégrafo de 5 agulhas. As agu- 
lhas eram movidas eletromagneticamente. A letra se- 
lecionada era a que ficava na intersecção da direção 
apontada por 2 das agulhas (as demais agulhas perma- 
neciam em uma posição neutra). 

In 1835, Samuel Finley Breese Morse (1791-1872), con- 
cebeu um método de representar letras e números atra- 
vés de pontos e traços (código Morse: -— = a, —... = 
b, —-—- = c, etc). Utilizando esse método, Morse ob- 
teve uma patente de telégrafo eletromagnético em 1873. Figura 2.9: Transis- 
Em comunicações telefônicas a longas distâncias, existe tor, Obtido de com- 


a necessidade de amplificação do sinal de voz, mas que puterhistory.com. 
também amplifica o ruído. Para resolver esse problema 

em amplificadores repetidores, Harold Stephen Black 

(1898-1983) mostrou a efetividade da realimentação negativa em 1927. A rea- 
limentação negativa é um conceito de fundamental importância na Teoria de 
Controle. 

Em 14 de agosto de 1894, Oliver Joseph Lodge (1851-1940) transmitiu sinais 
de rádio em um encontro da Associação Britânica para o Avanço da Ciência 
na Universidade de Oxford e obteve a patente US 609.154 de 1898, Electric 
Telegraphy. 

Em 1896, Guglielmo Giovanni Maria Marconi, Marquis of Marconi (1874-1937) 
requereu a patente britânica No. 12,039, concedida em 1897, Improvements 
in Transmitting Electrical Impulses and Signals, and in Apparatus therefor. 
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Computador digital 


Em 1854, George Boole (1815-1864) desenvolveu a Teoria da Álgebra de Boole 
(Boole, G. An Investigation of the Laws of Thought. Walton e Maberly, 1854) 
e em 1822, Charles Babbage (1791-1871) apresentou um modelo funcional do 
Difference Engine, que era uma máquina mecânica para produção automática 
de tabelas matemáticas. Em 1837, Babbage descreveu, mas não construiu, O 
Analytical Engine, um sucessor para o Difference Engine que possuía unidade 
lógico-aritmética, controle de fluxo de execução e memória. 


Em 1936, Turing concebeu uma máquina digital abstrata que utilizava instru- 
ções armazenadas na memória para sequenciar as suas operações. 


Em 1941, Konrad Zuse (1910-1995) logrou construir um computador digital 
controlado por programa, chamado Z3. 

Em 21 de junho de 1949, foi utilizado com 
sucesso o computador de programa arma- 
zenado Small-Scale Experimental Machine 
(SSEM), construído pela Universidade de 
Manchester e apelidado de “Baby”. 


Em 1944, John William Mauchly (1907- 
1980) e John Adam Presper Eckert Jr (1919- 
1995) propuseram a construção do Electronic 
Discrete Variable Automatic Computer (ED- 
VAC), utilizando a arquitetura de John von Figura 2.10: 


Computador 
Neumann (Margittai Neumann János Lajos, digital Zezinho, obtido de 


1903-1957). Foi entreque em 1949 ao Ballis- 
tic Research Laboratory. Era um computa- 
dor eletrônico de uso geral utilizando o con- 
ceito de programa armazenado. O EDVAC utilizava aproximadamente 6.000 
tubos de vácuo e 12.000 diodos, consumia 56 kW de potência, ocupava 45.5 m? 
de área e pesava 7.850 kg. 


http://www .aeitaonline.com.br. 


Em 1960, no IME, é apresentado um computador híbrido desenvolvido como 
o trabalho final do curso de engenharia eletrônica, construído por José A. 
M. Mendonça, Jorge M. Barreto, Herbert B. Fiuza, Edison Dytz, Mário M. 
Alencastro e Walter M. Lace, sob a orientação dos professores Antônio M. 
M. Chaves, Antônio J. D. Amarante, Danilo Marcondes, Rubens T. Carrilho, 
Werther A. Vervloet e Dr. Helmut T. Schreyer. 

Em 1961, no ITA, é apresentado o Zezinho, um computador digital desen- 
volvido como o trabalho final do curso de engenharia eletrônica, construído 
pelos formandos Alfred Volkmer, András G. Vásárhelyi, Fernando V. Souza e 
José E. Ripper Filho, orientado pelos professores Tien Wei Chu e Richard R. 
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Wallauschek. 


No dia 29 de outubro de 1969, ARPAnet enviou a primeira mensagem de um 
computador na UCLA para um outro em Stanford. A tecnologia de rede de 
computadores evoluiu rapidamente e, em 1970, Robert Elliot Kahn (1938-) e 
Vinton Gray Cerf (1943-) propuseram o Transmission Control Protocol and 
Internet Protocol, or TCP/IP. Em 1 de janeiro de 1983, a ARPANET adotou 
a TCP/IP e a rede de redes evoluiu para a Internet. 


A terceira revolução industrial, de meados do século XX a início do século 
XXI, é um efeito conjunto de vários fatores, incluindo a disseminação de equi- 
pamentos eletrônicos, avanços na tecnologia de semicondutores, a energia nu- 
clear, a disseminação do computador digital e efeitos decorrentes disso, como 
a robótica, Internet, além da descoberta de novos fenômenos físicos, como a 
supercondutividade e light amplification by stimulated emission of radiation 
(LASER), que impulsionaram o desenvolvimento de novos processos e produ- 
tos. Trata-se de uma época muito criativa, com inovações na indústria far- 
macêutica, imagiologia médica, explorações espaciais, mecanização agrícola, 
automação bancária, controle de tráfego e de cargas, armamentos inteligentes 
etc. 


Indústria 4.0 


A indústria 4.0 é a quarta revolução industrial, resultado da amalgamação de 
várias tecnologias avançadas, tais como a inteligência artificial, aprendizado 
de máquina, a computação em nuvem, big data, internet das coisas, robótica 
autônoma, realidade virtual, realidade aumentada, manufatura aditiva, proto- 
tipação rápida, energia limpa, sustentabilidade etc. 


2.1 IFAC 


O primeiro evento na área de Controle Automático foi realizado na Univer- 
sidade de Heidelberg entre os dias 25 e 29 de setembro de 1956 sob o título 
Regelungstechnik — Moderne Theorien und ihre Verwendbarkeit. Neste evento 
os participantes assinaram um acordo para a criação de uma organização in- 
ternacional e foi estruturado um Comitê Provisório sob a presidência de Victor 
Broida, responsável por fundar a International Federation of Automatic Con- 
trol (IFAC). 


Em 12 de setembro de 1957 foi realizada a Primeira Assembleia Geral, em 
Paris, no Conservatoire National des Arts et Métiers, com a participação de 
delegados de 18 países. A Primeira Assembleia Geral convocou a reunião 
constituinte em Paris. Nessa assembleia foram votados os Estatutos e eleito o 
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primeiro presidente, Harold Chestnut. 


O primeiro Congresso Mundial da IFAC ocorreu em Moscou entre os dias 27 
de junho e 7 de julho de 1960. 


A Sociedade Brasileira de Automática (SBA) foi fundada em 1975 e é uma 
National Member Organization (NMO) da IFAC no Brasil. 


2.2 


Livros-textos pioneiros 


O Prof. Dr. Luis Antonio Aguirre (AGUIRRE, 2015a) oferece uma análise 
aprofundada e contextualizada dos livros pioneiros da área de sistemas de 
controle. 


Alguns livros publicados antes de 1950 são: 


Tolle, M. Die Regelung der Kraftmaschinen, Springer Verlag, Berlin, 
1909. 


Oldenbourg, R. C. and Sartorius, H. The dynamics of automatic controls. 
The American Society of Mechanical Engineers, 1948. 


Smith, E. S. Automatic control engineering. New York: McGraw Hill, 
1944. 


Bode, H. W. Network analysis and feedback amplifier design. D. Van 
Nostrand Company, 1945. 


Hall, A. C. The Analysis and synthesis of linear servomechanisms. The 
MIT Press, 1943. 


James, H. M., Nichols, N. B., Phillips, R. S. Theory of servomechanisms. 
McGraw Hill, 1947. 


Eckman, D. P. Principles of industrial process control. John Wiley and 
Sons, 1945. 


Lauer, H., Lesnick, R., Matson, L. Servomechanism fundamentals. Mc- 
Graw Hill, 1947. 


Leonhard, A. Die selbsttdtige regelung. Springer Verlag, 1940. 


MacColl, L. A. Fundamental theory of servomechanisms. D. Van Nos- 
trand, 1945. 
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2.3 Controle no Brasil 


O ensino de Controle Automático no Brasil iniciou-se, possivelmente, em 1953, 
no Instituto Tecnológico de Aeronáutica (ITA), quando foi oferecida a disci- 
plina Controle Automático, ministrada pelo professor americano Edward Wil- 
son Kimbark, que foi o primeiro Chefe da Divisão de Engenharia Eletrônica. 


Em 1957, o professor Luiz Valente Boffi organizou o primeiro grupo para edu- 
cação e pesquisa em Controle Automático do Brasil, no Departamento de 
Engenharia Eletrônica do ITA. 


Posteriormente, na Escola Politécnica da USP, os primeiros cursos de controle 
automático foram lecionados em 1970, pelos professores Plínio Benedito de 
Lauro Castrucci e Luís Augusto Góes Calmon de Barros Barreto. 


Também em 1970, foi lecionado o primeiro curso de controle automático na 
Unicamp, pelo professor Manoel Sobral, que foi o primeiro diretor da então 
Faculdade de Engenharia de Campinas, da Unicamp, e foi também o primeiro 
a criar um Departamento de Automação em uma universidade brasileira. 


Na Universidade do Brasil, em 1963, hoje Universidade Federal do Rio de Ja- 
neiro (UFRJ), foi criada a Coordenação dos Programas de Pós-Graduação em 
Engenharia (COPPE). 


Alguns livros de autores do Brasil Embora não se analise detalhadamente como 
apresentado em (AGUIRRE, 2015a), acredita-se que a lista cronológica dos li- 
vros escritos por autores brasileiros, apesar de várias omissões, possa prover 
um retrato de como se desenvolveu o ensino de Sistemas, Controle e Automa- 
ção. 

No âmbito do tema Sistemas Dinâmicos, o excelente texto de autoria de autoria 
de Jacob Palis Jr. e Welington de Melo, editado pelo Instituto de Matemática 
Pura e Aplicada (IMPA), proporciona uma base sólida, incluindo os célebres 
resultados de Maurício Matos Peixoto e Stephen Smale, entre outros. 


e Boff, L. V. e Coutinho, J. A. M. Elementos de Análise de Sistemas 
Lineares. ETEGIL, 1966. 


e Castrucci, P. B. L. Controle automático: teoria e projeto. Edgar Blücher, 
1969. 


e Sighieri, L. e Nishinari, A. Controle automático de processo industriais 
- Instrumentação. Edgar Bliicher, 1973. 


e Castrucci, P. B. L. e Batista, L. Controle linear método básico. Edgar 
Bliicher, 1980. 
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Bottura, C. P. Princípios de controle e servomecanismos. Guanabara 
Dois, 1982. 


Bottura, C. P. Análise linear de sistemas. Guanabara Dois, 1982. 
Castrucci, P. B. L. e Sales, R. M. Controle digital. Edgar Bliicher, 1990. 


Castrucci, P. B. L. e Curti, R. Sistemas não lineares. Edgar Bliicher, 
1991 


Barczak, C. L. Controle digital de sistemas dinâmicos projeto e análise. 
Edgar Bliicher, 1995. 


Hemerly, E. M. Controle por computador de sistemas dinâmicos. Edgar 
Bliicher,1996. 


Cruz, J. J. Controle robusto multivaridvel. Edusp, 1996. 
Miyagi, P. E. Controle programável. Edgar Bliicher, 1996. 


Nascimento Jr, C. L. e Yoneyama, T. Inteligência artificial em controle 
e automação. Edgar Bliicher, 2000. 


Aguirre, L.A. Introdução à Identificação de Sistemas: Técnicas Lineares 
e não Lineares Aplicadas a Sistemas. Teoria e Aplicação. Editora da 
UFMG, 2000. 


Faleiros, A. C. e Yoneyama, T. Teoria matemática de sistemas. Arte e 
Ciência, 2002. 


Kienitz, K. H. Análise de circuitos — um enfoque de sistemas. Manole, 
2002. 


Coelho, A. A. R. e Coelho, L. S. Identificação de sistemas dinâmicos 
lineares. Editora da UFSC, 2004. 


Geromel, J. C. e Palhares, A. G. B. Análise linear de sistemas dinâmicos. 
Edgar Bliicher, 2004. 


Alves, J. L. L. Instrumentação, controle e automação de processos. LTC, 
2005. 


Bazanella, A. S. e Silva Jr., J. M. G. -Sistemas de controle: princípios e 
métodos de projeto. Editora da UFRGS, 2005. 


Campos, M. C. M. e Teixeira, H. C. G. - Controles típicos de equipamen- 
tos e processos industriais. Edgar Bliicher, 2006. 
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Este capítulo apresentou alguns dos marcos relevantes no desenvolvimento de 


sistemas de controle. 


controle nos seguintes campos 


1. Novas fontes de energia 


2; 


3. 


Sustentabilidade 


Mão de obra especializada 
. Comunicação digital 

. Qualidade da vida 
. Exploração espacial 
. Robótica 


. Veículos autônomos 


2.5.2 Exercício 


Comente sobre os possíveis impactos de sistemas de 


Liste 5 novas tecnologias que tem recebido atenção nos últimos anos e comente 
sobre o potencial impacto na sociedade do futuro, incluindo considerações 
sobre a Teoria de Controle Automático. 


Parte II 


Modelos de sistemas dinâmicos 
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Modelos dinâmicos 


“All models are wrong, but some are useful.” 


— George Box 


Modelos são representações das características essenciais do fenômeno em es- 
tudo. Por exemplo, maquetes podem ser utilizadas por arquitetos para estudar 
uma nova obra. Um farmacologista pode usar o camundongo como modelo 
para estudar os efeitos de um novo medicamento. Um pintor pode utilizar 
bonecos articulados como modelo para compor um novo quadro. 


Considerando o objetivo deste livro de tratar a análise e o projeto de sistemas 
de controle de modo quantitativo, os modelos requeridos são do tipo matemá- 
tico. 


Os modelos matemáticos utilizados aqui são predominantemente aqueles cons- 
tituídos por equações diferenciais ordinárias determinísticas de dimensão finita 
e invariantes com o tempo. 


Porém, na prática, os sistemas físicos podem apresentar fenômenos tais como 
não linearidades, variações espacialmente distribuídas, atrasos nas respostas, 
perturbações aleatórias e parâmetros que variam com o tempo, entre outras 
possibilidades. 


Logo, algumas simplificações podem ser necessárias: 


1. Sistemas em que as grandezas de interesse dependem simultaneamente 
do tempo e a posição no espaço, modeladas por equações diferenciais 
parciais, são aproximados por modelos com parâmetros concentrados. 
Por exemplo, as tensões v(t, x) e correntes i(t, x) para cada posição x ao 
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longo de uma linha de transmissão em cada instante t são dadas por 


o Õ. 
Ra = ato — Ri(t, x) (3.1) 
zita) = -0l 2) — Gu(t, x) (3.2) 


em que R [Q/km], L [mH/km], C [nF/km], e G [uS/km] são res- 
pectivamente a resistência, indutância, capacitância e condutância por 
comprimento do segmento da linha. Uma aproximação seria cascatear 
vários módulos (R, L,C,G) de parâmetros concentrados, cada uma mo- 
delando, por exemplo, 1 km da linha. 

Quando as frequências envolvidas de v e à são baixas, o comprimento de 


onda pode ser muito maior que o comprimento da linha, caso em que v 
e 1 seriam iguais em qualquer trecho da linha. 


Figura 3.1: Aproximação por um modelo de parâmetros concentrados. 


Em casos de processos que envolvem vibração, é frequente o uso do 
método de decomposição em modos. 


No caso mais simples de uma viga homogênea engastada em um extremo 
e livre no outro, o movimento é descrito por 


$ y(t 

axt Ot? 
em que E é o módulo de elasticidade, J o momento de inércia, p a 
densidade do material da viga e A a área da secção transversal. Os 
modos de vibração, nesse caso, podem ser vistos na figura 3.2. 


(3.3) 


. Quando o modelo do sistema varia com o tempo, os parâmetros da equa- 


ção diferencial também variam com o tempo. Se a variação é periódica e 
de frequência elevada, poderá ser utilizado o modelo médio. Um exem- 
plo é o caso de fontes chaveadas, em que a frequência de chaveamento 
é muito maior do que as constantes de tempo do restante do circuito. 
Em um outro processo, a variação pode ser muito lenta em comparação 
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Figura 3.2: Estudo de modelos a parâmetros distribuídos mediante decompo- 
sição de modos. No caso, modos de vibração de uma viga engastada 


com a dinâmica das variáveis de interesse, podendo-se utilizar um mo- 
delo congelado. Por exemplo, o atrito em mancais de máquinas rotativas 
tende a crescer com o tempo, mas esse processo é, em geral, muito mais 
lento do que a dinâmica do eixo do rotor. 


3. Atrasos no tempo levam a equações diferenciais do tipo 


x=f(x(t),x(t— T)) (3.4) 
x(T) =xo(T) TE[-T,0] (3.5) 


que significa dimensão infinita (deve-se fornecer xo(T) em infinitos valo- 
res de 7). Quando for possível utilizar a transformada de Laplace (siste- 
mas lineares invariantes no tempo), tem-se que L[f(t — T] = esT F(s), 
que pode ser tratado de modo relativamente simples. 


3.1 Modelos de tempo contínuo 


Uma vez que os sistemas físicos de interesse envolvem grandezas que variam 
com o tempo, os modelos buscam expressar essa característica de modo direto 
ou indireto através da utilização de parâmetros que representam o tempo. 
Na prática são utilizadas as equações diferenciais no caso de modelos de tempo 
continuo (y(t),t € R) e equações a diferenças no caso de tempo discreto 
(y[k],& € N) em que y = A(x). 


3.1.1 Equações diferenciais ordinárias 


Os modelos de tempo contínuo estudados neste livro são representações ba- 
seadas em equações diferenciais ordinárias (EDO), ou seja, as grandezas de 
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interesse evoluem no tempo t conforme 


d'y dy 


So dig t) = : 
ae ELA ) 0, (3 6) 


em que y é a saída, u é a entrada, t é o tempo e F alguma função que busca 
descrever o comportamento do sistema. (OBS: Para simplificar a notação, y e 
u são assumidas pertencerem a R) nesta Seção. 


O sistema é dito ser linear se a função F assume a forma particular 


mn n=ly 


d'y 
q talt 


d 
Tr EE 


et nl oll 87 


ou seja, d*y/dt*, k = 0,1,...,n não estão multiplicados entre si e nem partici- 
pam como argumento de funções que não sejam da forma f(E) = a€ + 8, com 


a e BER. Por exemplo f(E) = sin(€), f(€) = log(€) e f(E) = & com q 1. 


Caso os parâmetros ay(t), k = 1,2,...,n não dependam explicitamente de t, 
ou seja, a1, ..., an São números reais, os sistemas são denominados LTI (Linear 
Time Invariant). 


As vezes, sistemas invariantes no tempo são referidos como sendo sistemas 
autônomos. 


d'y daly dy 
qin + gaat + + Ont + any = u(t) (3.8) 
Ressalta-se que a equação 3.8 poderia incluir também termos do tipo du as a, 


caso em que se teria um novo u(t) constituído da combinação desses. 
Uma notação muito usada para simplificar a escrita é usar y no lugar de ay 


.. 2 n . 
y no lugar de o e y™ no lugar de TY, ou seja, 


dy dy (n1) ey (n) _ TY 
“qu “q é gat} Y= Gm (89) 

de modo que a expressao 3.8 pode ser reescrita mais compactamente 
y™ + ayy) +--+ an-3y® + ani + an—1y + any = u (3.10) 


Os modelos, tanto os de tempo continuo quanto os de tempo discreto, podem 
ser obtidos através de dois enfoques principais: 


e o de caixa branca (ou transparente); e 


e o de caixa preta (ou caixa opaca). 
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No caso de enfoque caixa branca, admite-se que são conhecidas as leis físicas 
que regem o comportamento do sistema que se encontra no seu interior (por 
exemplo, Leis de Kirchhoff, Lei de Newton, princípio da mínima ação, equação 
de continuidade, conservação da energia etc.) 


No caso de enfoque caixa preta, busca-se obter o modelo a partir dos registros 
dos sinais de entrada e da saída do sistema (caixa) (por exemplo, uma sequên- 
cia de pares entrada-saida {u[k], y[k]}x=1,2,... obtidas com a utilização de um 
equipamento digital para aquisição de dados). 


O procedimento para obter modelos utilizando o enfoque caixa preta é cha- 
mado, usualmente, de identificação. Na prática é comum o emprego de méto- 


A Ajuste buscando (O Leis 
CN consistência C9 Físicas 


Figura 3.3: Enfoques para obtenção de modelos matemáticos. 


dos híbridos, em que se combinam os enfoques de caixa preta e de caixa preta, 
às vezes chamado de caixa cinza (ou translúcida). Por exemplo, à luz dos co- 
nhecimentos das leis físicas, pode-se conhecer a estrutura do modelo buscado, 
mas os seus parâmetros são determinados a partir de registros de entrada e 
saída (no caso, mediante identificação paramétrica). 


Antes de apresentar alguns métodos de modelagem, é interessante mencionar 
duas frases encontradas no livro Luyben, W.L. Process Modeling, Simulation 
and Control for Chemical Engineers. McGraw Hill, 1989: 


1. The simplest control system that will do the job is the best. 


2. You must understand the process before you can control it. 


Este livro busca tratar o problema de projeto de controlados utilizando 
métodos quantitativos, de modo que é imprescindível a disponibilidade de 
modelos matemáticos. Os modelos matemáticos predominantes nesta obra 
são do tipo Equações Diferenciais Ordinárias lineares e invariantes no tempo, 
obtidos eventualmente por aproximações de modelos mais gerais. 
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3.2 Modelagem usando leis físicas 


Nessa seção serão explorados alguns métodos de modelagem utilizando o en- 
foque “caixa branca” utilizando leis físicas bem conhecidas. 


3.2.1 Leis de Kirchhoff 


Exemplo: Circuito de Sallen-Key 


Considere o circuito apresentado na figura 3.4, que possui dois armazenadores 
de energia (2 capacitores) e cujo modelo pode ser obtido utilizando-se as Leis 
de Kirchhoff (vide, por exemplo, (DESOER, 1969)). 


Figura 3.4: Circuito de Sallen-Key. 


Segundo a Lei de Kirchoff para correntes, tem-se que 
i — tp —i3 =0 (3.11) 


Pela Lei de Kirchoff para tensões, e lembrando que a entrada de corrente em 
um OpAmp (Amplificador Operacional) é quase zero, em face ddesua impe- 
dância elevada de entrada, e também que a diferença de potencial entre os 
seus terminais + e - é negligenciável em face do seu elevado ganho, obtém-se 
o conjunto de equações 


1 
—u + Riy + Rig + 24 = 0 (3.12) 
—v +v +y = 0 (3.13) 


1 
—v2 + Rig + 2Y (3.14) 
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O comportamento tensão-corrente dos elementos do circuito é descrito por 


i = Coy (3.15) 
e oF (3.16) 


e, portanto, combinando as equações 3.12 e 3.11, obtém-se 


1 

Rij +Rist+5y = u (3.17) 
1 

R(ig+%3)+ Rist sy = u (3.18) 
1 

RCi + RCY+ af = tl (3.19) 


Combinando-se as equações 3.11 a 3.19, pode-se escrever 
y C 1 
R (cnc? = Sa) +ROj+5u=Uu (3.20) 


e a equação diferencial que descreve o circuito da figura 3.4 pode ser colocada 
na forma padrão 


RCj + RCy +y = 2u (3.21) 


Esse circuito é um filtro de segunda ordem muito utilizado na prática e cujo 
comportamento poderá ser mais bem estudado após o capítulo sobre resposta 
em frequência. 


Um fato importante na obtenção desse modelo é que não foi considerada a 
possível saturação do OpAmp. Por exemplo, se a alimentação do OpAmp for 
de +15 V, não é conveniente que a saída y se aproxime desses valores. 


3.2.2 Modelagem usando o conceito de Lagrangiano 


A modelagem baseada no conceito de Lagrangiano é muito frequente em várias 
áreas da Engenharia e tratamentos formais do método podem ser encontrados 
em livros como (GOLDSTEIN, 1980). 


Esse método de modelagem é baseado no princípio da mínima ação ou de 
Hamilton, segundo o qual fenômenos físicos cuja evolução é representada por 
coordenadas q minimizam a expressão 


Ala] = |" c(a(t),4(t), ) dt (3.22) 


to 
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em que o Lagrangiano £ é a diferença entre as energias cinética T e potencial 
U, 
L=T-U (3.23) 


Uma condição necessária para que uma função q(t) seja solução do problema 
de minimização de A(q) é que satisfaça a equação de Euler-Lagrange (no 
sentido estendido em relação ao Apêndice A) 


d (55) aL OR -Q (3.24) 


ala) da "dá 


O termo R (termo de Rayleigh ) estará presente se houver dissipação de energia 
para o meio ambiente, usualmente como metade da potência dissipada e Q são 
forças externas (forças, torques, tensão, corrente, pressão, vazão etc.). 


Observação: Apresenta-se no Apêndice A uma condição necessária para que 
uma função x(t) seja um ponto estacionário para o problema de minimização 


de 
Jp] = fc @,x(),2) dt (3.25) 


0 


A condição necessária para otimalidade de x* é conhecida como a equação de 


Euler-Lagrange 
d [ Oc Oc 


x=x* 


Para a modelagem de sistemas, faz-se a associação 


x ~~ q (3.27) 
cu L (3.28) 
J(x) ~ A(q) (3.29) 


Um tratamento mais rigoroso desse problema pode ser encontrado, por exem- 
plo, em (BLISS, 1980), (GOLDSTEIN, 1980), (YOUNG, 1969), entre outros. 


A formulação mais geral que inclui os termos R e Q pode ser encontrado em 
(WELLSTEAD, 1979). 
Exemplo: Máquina de Atwood 


Para ilustrar o procedimento, considere o sistema de polias ilustrado na figura 
3.9, em que a corda que une as massas my e ma possui comprimento L. 
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Utilizando-se conceitos básicos de física, pode-se escrever as expressões para 


as energias cinética T e potencial U para esse sistema: 


1 1 
T ue + 5 Mad? 
U = -mgg-mog(L-—q) 


em que q é o deslocamento e q é a velocidade. 


ma 
Figura 3.5: Máquina de Atwood. 


A expressão do Lagrangiano para a máquina de Atwood é 


L T—U 


E RD T 
= =m x 
simg + mad 

+ma gg + mag (L — q) 


d (ƏL OL _4 
dt \ Og dq 


e, portanto, fazendo-se 


em que 
OL 
= = mg-m 
da 19 29 
OL . E 
> > mqg—-m 
dã 19 24 


d (3) ' . 
— | 5 = mq+ maq 


(3.32) 


(3.33) 


(3.34) 


(3.35) 


(3.36) 


(3.37) 
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obtém-se a equação diferencial que descreve o seu comportamento 


(my + m2) ğ — mig + meg = 0 (3.38) 
2 my — ma 

= ee fae 3.39 

ae ear (3.39) 


Exemplo: Péndulo Simples 


Seja um péndulo simples com haste rigida, conforme ilustrado na figura 3.6. 


Posição de 
Repouso 


Figura 3.6: Pêndulo simples. 


Verifica-se pela figura 3.6 que 


= Lsin(0) (3.40) 
—Lcos(0) (3.41) 


em que L é o comprimento da haste, m é a massa da esfera, g é a aceleração 
da gravidade e O é o ângulo da haste com a vertical. 


As expressões para a energia cinética T e a potencial U são 


1 1 A 
T zma” a) = mI26? (3.42) 
U = —mgL cos(0) (3.43) 


Logo o Lagrangiano é dado por 


1 . 
L= zmr o? + mgL cos(0) (3.44) 
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Os termos necessários para aplicar a condição de Euler-Lagrange são 


OL : 
aa — —mgL sin(0) (3.45) 
U 2 wie (3.46) 
00 

d fOlL\ _ 28 


Tem-se, portanto, que o modelo do pêndulo simples é 
mL26 + mgLsin(0) = 0 (3.48) 
é= - sin(@) (3.49) 


subsubsectionExemplo: Péndulo com Haste Elástica De modo análogo ao 
exemplo anterior (Pêndulo Simples), seja agora o caso em que a haste é elástica 


i 
Y an 
i) wr 
Ego A e 
Rm Es oe 
k À a 
Posição de” 


Repouso 


Figura 3.7: Pêndulo com haste elástica. 


As expressões para T e U são 


T = m(2+(L+e6?) (3.50) 
U = —-mg(L+e)cos(0) + Ske (3.51) 

Logo, o Lagrangiano é dado por 
L= sm (e +(L+ 6?) + mg(L + e) cos(9) — she? (3.52) 


Os termos necessários para aplicar a condição de Euler-Lagrange são 
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aL 
Oe 
aL 
ð 
aL 
de 
aL 
00 


a (ae) _ 
dt lide! 


a (ac) _ 
dt 00 ) 


mg cos(0) — ke + m(L + e)? 


—mg(L + e) sin(0) 


m(L + e)é0 + m(L + e)26 


(3.53) 
(3.54) 
(3.55) 


(3.56) 


(3.57) 


(3.58) 


Substituindo-se esses termos na equação de Euler-Lagrange, obtém-se que 


mê — mgcos(@) + ke — m(L + e)? = 0 
m(L + e)é0 + m(L + e)260 + mg(L + e) sin(®) = 0 


(3.59) 
(3.60) 


O modelo pode ser colocado na forma de espaco de estados definindo-se, por 


exemplo, x = [e é 0 6]. 


Exemplo: Péndulo Duplo 


Considere agora um péndulo duplo como a ilustrada na figura 3.8 Considere 


Figura 3.8: Péndulo duplo. 
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o pêndulo duplo ilustrado na figura 3.8, em que se verifica que 


bj = Ty sin(01) (3.61) 
wm = Lli sin(01) + Lo sin(95) (3.62) 
yı = —Iicos(01) (3.63) 
y2 = —licos(01) — Lo cos(05) (3.64) 
As expressões para a energia cinética T e a potencial U são 
1 1 À . 
T = zm” +4’) + 5 ma(aiz + yn”) (3.65) 
1 - ol ; ; 
= 5m Li, 5r2[L 303 + 1262 (3.66) 
+211L,0,05 cos(04 — 95)] (3.67) 
U = migyi + Mmgy2 (3.68) 
= —(m + mo)gL; cos(01) (3.69) 
—magLo cos(02) (3.70) 
Calculando-se os termos 
GL. OF ƏL ƏL gf OL \ dj DL (3.71) 
00,’ 002” 00‘; 002’ dt om)" dt \ 00, l 


e utilizando-se as equações de Euler-Lagrange, obtém-se o modelo do pêndulo 
duplo 

0 = (ma + mo)L101 + moLs cos(01 — 95) + (3.72) 

+moLo02 sin(01 = 95) + (ma + m2)g sin(01) (3.73) 

0 = [89 + Lô cos(01 = 95) = LÔ? sin(01 = 02) + g sin(02) (3.74) 


Exemplo: Massa + Mola + Amortecedor 


Embora o modelo para um sistema massa+mola+amortecedor possa ser ob- 
tido facilmente pela utilização das Leis de Newton, apresenta-se aqui a versão 
baseada no Lagrangiano. 

As expressões para a energia cinética T e a potencial U são 


1 
T = a má? (3.75) 


1 
U = sha (3.76) 
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X= 
b A 


f 


Figura 3.9: Sistema massa, mola e amortecedor. 


Como existe um amortecedor, há dissipação de energia e 


1 
R= by 
2 q 
Logo o Lagrangiano é dado por 
1 1 
l= 2 “hk 2 
ge 2 q 


Aplicando-se a condição de Euler-Lagrange 


d (02) OL ORA 
dt \ 0 dq dq 
em que 
ac 
dq T 
OL = ma 
ag O Ma 
a OL = mä 
d log) "4 
ƏR l 
ag T 


Q 


(3.77) 


(3.78) 


(3.79) 


(3.80) 


(3.81) 
(3.82) 


(3.83) 


obtém-se o modelo para o sistema massa + mola + amortecedor (Q = f) 


mä + bg + kq =f 
Exemplo: Circuito RLC 


(3.84) 


O método do Lagrangiano é aplicável também para o caso de circuitos elétricos 
Nesse exemplo adota-se como a grandeza básica a carga q. 


As expressões Te U são 


(3.85) 


(3.86) 
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Cc =a 


Figura 3.10: Circuito RLC Série. 


Logo o Lagrangiano é dado por 


1 1 
= Lè — — q 3:87 
£ zÝ — 501 (3.87) 


Aplicando-se a fórmula de Euler-Lagrange com Q = v obtém-se o modelo do 
circuito RLC série 


1 
Li + Ra+ 5q =v (3.88) 


Exemplo: Um Sistema Eletro-Mecânico 


A utilização do conceito de Lagrangiano é particularmente interessante para 
modelagem de sistemas que envolvem simultaneamente componentes de dife- 
rentes naturezas (elétrica, pneumática, hidráulica, mecânica). 

Considere o sistema eletromecânico ilustrado na figura 3.11 e que envolve gran- 
dezas eletromagnéticas e mecânicas. 


Figura 3.11: Um sistema eletromecânico acoplado. 


Notar que movimento da massa m devido à atração magnética afeta o valor 
da indutância L(z). 
O Lagrangiano é da forma 


Elétrica Mecânica 


E: D DE 
L=5|L()ã +m’ — kz”| (3.89) 
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Os elementos dissipadores de energia são o resistor e o amortecedor 


1 1 
R= o Rá? + aê (3.90) 


Pela fórmula de Euler-Lagrange, tem-se 


d [OL OL OR 
(Bi) det ag = vo ECM REM (3.91) 
d (ƏL\ ƏL OR _ ES TOFA 


O modelo do sistema eletro-mecânico obtido das equações 3.91 e 3.92 é dado 
por 


L(z\jġ+ Rå = v (3.93) 
ldL 
mž+bż+kz-=-—¿ = 0 (3.94) 
2 dz 
3.2.3 Modelagem utilizando analogia 
Diferentes sistemas podem ser descritos por 
equações diferenciais com a mesma estrutura, po- Vo 
; E i a R LS 
rém com parâmetros (coeficientes) distintos. | 
E 
Como exemplos, considere os três sistemas ilus-  v( c 
trados na figura 3.12, descritos pelas equações: E 
d d 1 
L Lg + RGE + ve = ge i> RELSpi e 


dir 1 diz Ls .. Eg 
E Rod CRC E 


b H— 


Nota-se nessas equações que a estrutura é idên- 
tica, mas os parâmetros (coeficientes das equa- Figura 3.12: Três siste- 
ções diferenciais) são distintos. mas: Circuito Série, Cir- 


Logo, ajustando-se os valores numéricos dos coe- Cuito Paralelo e Massa- 
ficientes, a solução da EDO seria numericamente Mola-Amortecedor. 
idêntica. 

Esse conceito pode ser usado para utilizar circuitos elétricos para simular dis- 
positivos mecânicos, hidráulicos e pneumáticos. 

No passado era comum o uso de computadores analógicos que eram capa- 
zes de traçar a respostas de equações diferenciais mediante a interconexão de 
integradores, somadores, inversores e outros dispositivos. 
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Analogia eletromecânica 


1. Analogia força-tensão: Se a grandeza f for associada a v (com correção 
4) as soluções das EDO’s 1 e 3 serão as mesmas se, numericamente, 
L=m,R=beg=k. 


2. Analogia força-corrente: Se a grandeza f for associada a v (com correção 
t) as soluções das EDO’s 1 e 2 serão as mesmas se, numericamente, 
C=m, R! =be+4 =k. 


Variáveis de esforço e de fluxo 


De modo generalizado, dado um componente, podem ser definidas variáveis 
de esforço e de fluxo (ou across e through), por exemplo, tensão x corrente ou 
força x velocidade. 


Em alguns textos, as variáveis de esforço são referidas como variáveis “entre” 
(effort, across), denotadas e(t), como a diferença de tensão, de pressão e de 
temperatura). As variáveis de fluxo são referidas como de “através” (flow, 
through), denotadas f(t), como a corrente, o fluxo de fluido e o fluxo de calor). 
Além de e(t) e de f(t), são importantes as seguintes grandezas: 


e Potência Instantânea: P(t) = e(t) f(t) 


e Energia Transferida: E(t) = i P(r)dr 


Fluxo Acumulado: q(t) = i f(r)dr 


Esforço Acumulado: p(t) = fy e(r)dr 


Exemplo 


Se a grandeza f for associada a à (com correção +) as soluções das EDO’s 1 e 


2 serão as mesmas se, numericamente, C = m, t be t k e, além disso, 


e Potência Instantânea: P(t) = v(t)i(t) 
e Energia Transferida: E(t) = f P(r)dr 


Fluxo Acumulado (carga elétrica): q(t) = k f(r)dr ou i = dg 


Esforço Acumulado (fluxo magnético): ¢(t) = i e(T)dT ou v = a% 
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O método pode ser adaptado a sistemas térmicos (resistência térmica R, 
capacitância térmica C, variável entre = T, temperatura, variável através = 
i, fluxo de calor Q): 


T = Ri (3.95) 
i= C= (3.96) 


e a sistemas hidráulicos (resistência R, capacidade volumétrica C, variável 
entre = p, pressão, variável através = q, vazão, como já visto anteriormente 
no exemplo de tanques. 


3.2.4 Atraso de transporte 


Um importante fenômeno encontrado, por vezes, na prática é o de atraso puro 
ou de transporte. 


Um exemplo de situação em que ocorre o atraso de transporte encontra-se 
ilustrado na figura 3.13, em que, com periodicidade T, um corante é injetado 
no fluxo de água. Um sensor baseado na absorbância de um feixe luz detecta 
a presença da água colorida como o sinal u(t). Quando o plugue de água 
colorida atinge o sensor na saída da tubulação é gerado o sinal y(t). Nota-se 


Tinta ; ; 
Pulsada com A i : ; 
Período T ps 
: Sensor 1 Sensor 2 : 
— 
Água H 


=== 2222022022. ------ — > 
Atraso de Transporte de T y 


Figura 3.13: Devido ao tempo para o plugue de água corada percorrer a tubu- 
lação, a leitura do segundo sensor (em verde) é atrasada em relação ao primeiro 
(em vermelho). 


pelo gráfico da figura 3.13 que o pico do sinal y(t) ocorre com atraso de 0 
unidades de tempo, em relação ao sinal u(t). Nesse exemplo, a forma de onda 
de y(t) é mais “alargada” do que u(t) em vista de a tinta ter se difundido para 
a vizinhança do plugue. 

Caso a forma de onda de y(t — 0) seja a mesma que de u(t), ter-se-á o caso de 


atraso puro, ou seja, 
y(t) = u(t — 0) (3.97) 


Modelos dinâmicos 59 


3.3 Validação de modelos 


Os modelos devem caracterizar “adequadamente” o fenômeno físico sob estudo. 
Porém o qualificativo “adequadamente” necessita ser tornado mais preciso. 


e O modelo deve ser o mais simples possível, conforme preconizado pelo 
princípio da Navalha de Ockham (William of Ockham, 1287-1347). Mo- 
delos complexos e que levam em consideração efeitos negligenciáveis di- 
ficultam o projeto sem o devido benefício. 


e É prudente estabelecer figuras de mérito para uma análise da adequação 
do modelo escolhido. Por exemplo, calculando a diferença entre as res- 
postas do modelo e do processo para uma mesma excitação. Quando se 
utiliza simulação como em casos em que não há acesso a todo o processo, 
pelo menos alguns sensores, atuadores ou processadores reais podem ser 
incorporados para que os resultados seja mais próximos àqueles a serem 
observados no campo. 


e O modelo pode ser considerado validado, de fato, quando o projeto é 
incorporado ao processo físico e o resultado atende às especificações téc- 
nicas preestabelecidas. 


3.4 Incertezas em modelos 


As leis de controle determinadas com o uso de modelos inadequados podem 
apresentar desempenho aquém do esperado quando utilizado com os processos 
reais. 


Entre os diversos exemplos de fatores que contribuem para a degradação do 
desempenho estão 


e Sinais que se afastam muito do ponto de operação. É exemplo uma mola 
que obedece à lei de Hooke para pequenos tracionamentos (f = kx) mas 
tende a ficar mais dura se for muito solicitada ( f= ka?) e, eventual- 
mente, pode se romper. Um outro exemplo é o fato de que intensidades 
muito grandes de campo magnético tendem a produzir saturação do nú- 
cleo ferromagnético, alterando a indutância de reatores. 


e Ruídos desconsiderados. São exemplos as vibrações da plataforma onde 
está instalado o equipamento, interferências devidas a campos eletro- 
magnéticos geradas por centelhamento em máquina de solda a ponto, 
rajadas de vento, entre outros. 
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e Valores nominais discrepantes. São exemplos os componentes eletrôni- 
cos comerciais que podem apresentar tolerâncias grandes, por exemplo, 
capacitor com C = 1.0 uF + 20% ou utilização de insumos com baixa 


pureza. 


e Fenômenos não modelados. São exemplos folga de engrenagem, atrito 
seco, modos de flexão de vigas, anisotropia do meio, entre outros. 


Variações lentas com o tempo. São exemplos o envelhecimento de com- 
ponentes, o deslocamento do centro de massa devido ao consumo de 
combustível, oscilações climáticas, entre outras possibilidades. 


Desconsideração dos atrasos de transporte. São exemplos a demora na 
recepção de sinais devido à localização remota do sensor, utilização de 
rede internet para transmissão de dados, tempo de processamento para 
cálculo do sinal de controle, entre outras possibilidades. 


Utilização inadequada. São exemplos a operação de veículos com excesso 
de passageiros, ausência de proteção em ambientes hostis, manutenção 
de baixa qualidade, entre outros, levando a variações incertas e desco- 
nhecidas dos parâmetros do modelo. 


A modelagem de sistemas pode ser auxiliada por ferramentas tais como os 
grafos de ligação (bond graphs), analogia e fluxografo (flowgraph). Exis- 
tem, ainda, ambientes de software específicos para modelagem de sistemas, 
muitos dos quais gratuitos, que já possuem vários componentes prontos que 
podem ser interligados graficamente. 


3.5 Solução de EDOs lineares 


O comportamento de sistemas dinâmicos de tempo contínuo são frequente- 
mente descritos por equações diferenciais ordinárias (EDOs). 


A solução de uma EDO típica (representando sistemas LTT) 
y™ + ayy) +... + an-1y + any =u (3.98) 


pode ser obtida através de varios métodos. 


Neste texto serão apresentados apenas dois métodos, em vista da importância 
destes no contexto de problemas de controle: 


e via formulação no espaço de estados; e 


Modelos dinâmicos 61 


e através da utilização da transformada de Laplace. 


Ambos os métodos são detalhadamente estudados em obras tais como (CHEN, 
1970), (OGATA, 1970), (SHINNERS, 1972), (KUO, 1980), (FRANKLIN; 
POWELL; EMAMLNAEINI, 1986) (DORF; BISHOP, 1995) e (HESPANHA, 
2009), entre outros. 


3.5.1 Espaço de estados 


Embora a equação diferencial ordinária de n-ésima ordem 3.98 possa ser tra- 
tada diretamente, aqui optou-se por transformá-la em n equações de primeira 
ordem, mediante o artifício de se fazer 


É = y (3.99) 

xo = Ñ (3.100) 

En = yr (3.101) 
em que y = a y = ay e, a partir de n = 3, é usual utilizar a notação 
yo) = ay 


Nessas condições, tomando-se derivadas em t nas equações 3.99, obtém-se o 
sistema de equações diferenciais 


ii = j=22 (3.102) 
to = Y= %3 (3.103) 
à = y™ = ayy) — ... - an-1y — any +u (3.104) 

= -—Q1Xy — ... — Gn—1 LQ — AnX1 + U (3.105) 


O vetor x = [a £2 ... £n], será chamado de estado. No contexto de Enge- 
nharia de Controle, estado é um conjunto de grandezas de um sistema que, 
se conhecidas em um instante, permite que se determine o valor futuro dessas 
grandezas, caso sejam fornecidas os sinais de entrada). 


Intuitivamente, estado é aquele conjunto de grandezas que, se for conhecido 
em um certo instante t, os valores futuros x(7), T > t podem ser determinados 
caso conheça as entradas u(0), o E [t,7] 


Utilizando-se a notação matricial, as expressões 3.102 a 3.105 podem ser agru- 
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padas na forma 


0 1 0 0 
0 1 0 0 
x= x+ u (3.106) 
0 0 0 1 
an an-1 Qn—-2 "7° —M 1 
——— aal — 
A B 


De 3.102 a 3.105 , depreende-se também que 
y=[1 0 > 0 0)x (3.107) 
a 


N: 


C 
Será visto mais adiante que a representação no espaço de estados x = Ax+ Bu 
não é única (por exemplo, uma representação diferente pode ser obtida fazendo 
se uma transformação similar z = Px em que P é não singular). 


A solução do sistema de equações diferenciais ordinárias 3.106 pode ser deter- 
minada, por exemplo, pelo método construtivo utilizando a iteração de Picard 
apresentado no Apêndice B. 


Aqui, será apenas verificado através de substituição que a expressão 
t 
x(t) = x (0) +f e^t- Bu(r)dr (3.108) 
0 
satisfaz 


x = Ax + Bu (3.109) 


com a condição inicial x(0). 
De fato, notando que a variável de integração é T e não t, a equação 3.108 é 
reescrita como 


x(t) = e™x(0)+e^ a e A™Bu(r)dr (3.110) 


0 
t 
E (x (0) +f e ArButrjdr) (3.111) 
0 
Diferenciando-se a expressão 3.110 em t, obtém-se 


t 
x = Ae“ (x (0) +f Bude] +eAte-AtTBu (3.112) 
0 


—— mamama 
x 


x = Ax+Bu (3.113) 


Portanto, de fato, a expressão 3.108 é a solução de 3.109. 
Necessita-se, agora, de um método eficiente para caracterizar elAt) 
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3.5.2 Exponencial de matriz 


Na expressão 3.108 está presente um termo denotado e^. 


É conveniente mencionar que, por definição (BARNETT, 1990), 
1 1 
eM ATI Ate gar + ae +. (3.114) 


e que o polinômio característico A(A) de uma matriz Anxn é dado por 


A(A) det(AI — A) (3.115) 


Mag ety a (3.116) 
Seja agora A(M) definido por 


A(M) = M” + a, M™! +... + an-1M + anlxn (3.117) 


em que M é uma matriz quadrada n x n. (Note que A : C — C, enquanto 


A:R"*" — RºX" mas os coeficientes a;,i = 1, 2,...,n são os mesmos.) 


O teorema de Cayley-Hamilton (vide Apéndice C) afirma que 
A(A) =0 (3.118) 


Para P(M) um polinômio matricial de ordem qualquer, pode-se escrever a 
identidade 


P(M) = Q(M)A(M) + R(M) (3.119) 


em que a maior potência de R(M) em 3.119 é (n—1). 


Nota-se, agora, que para o caso M = A 


ABAS + R(A) (3.120) 
A) (3.121) 


P(A) 


Q( 
= R( 
ou seja, um polinômio P(A) de ordem arbitrária, por exemplo, eĉ ou A1, 
pode ser escrito com potências de A até grau n — 1. 

Portanto a exponencial de matriz e^t pode ser expressa como uma soma pon- 
derada por pesos ay(t) de potências AF de A para k = 1,2,.,n— 1, ou 
seja, 


eAt = ag(t)I + a(DA + a(t) A? +--+ an1 (t) A”! (3.122) 
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Os coeficientes ay(t), k = 0, 1, ...,n — 1 podem ser determinados resolvendo-se 
o sistema de n equações com o mesmo formato que a expressão 3.122 

Ait — ag(t) + ay(t)Ay + a(t) A? ++ paar (3.123) 
ao(t) + a (t)à2 + a(t) A3 +. + On—1(t) AR" (3.124) 


q 
| 


Ant ao(t) + oa (t) An + ao(t)AZ + + aca (3.125) 


q 
II 


em que Az, k = 1,...,n são os autovalores de Anxn- 


Caso os autovalores sejam distintos, i # j — A; Ż Aj, O sistema em 3.125 será 
de n equações a n incógnitas. 


Resolvendo-se o sistema de equações 3.123 obtém-se as expressões para ay(t) 
em função de e^t, ..., et e colecionando-se os termos em et obtém-se 


n 
e^t = Y Mye™! (3.126) 
k=1 


em que My são matrizes com entradas reais. 

Se houver auto-valores com multiplicidades maiores que 1, então, deve-se uti- 
lizar as expressões derivadas. 

Por exemplo, se A; possui multiplicidade 3 (< n), então deriva-se 2 vezes em 
A; a expressão eòt para se obter 3 equações. 


eM = ao(t) +ar(t)Ai + as(DA + anat) (3-127) 
teòt = ay(t) + 200(DA +--+ (n — 1) ana (DAP? (3.128) 
Pet = 20t) + 6ag(t)Ai--- + (n — 2) (n — 1) anca(t)AP? (3.129) 


Exemplo: Motor DC de ima permanente 


Considere um motor DC controlado pela ar- 
madura e tendo como carga o seu rotor. 


O circuito de armadura apresenta resisténcia 
R e indutância L, o momento de inércia do 
rotor é J, a velocidade angular de rotação do Vs 
eixo é w e o torque é T. À corrente de ar- 
madura é ia, a tensão é va e a força contra 
eletromotriz induzida é eg. Nesse exemplo, o 
coeficiente de atrito B é considerado nulo. 


Figura 3.14: Motor DC aci- 
onado pelo circuito de arma- 


A lei de Newton, aplicada à parte mecânica, dura. 


permite escrever 


dw 
Jg = (3.130) 
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e, notando que em motores DC, 


T= Koia (3.131) 
obtém-se d 
W i 
J = Kia (3.132) 


Por outro lado, a lei de Kirchoff aplicada à parte elétrica leva a 


dia 


— ea = Ria + L— 3.133 
Va — €a ta + dt ( ) 

em que a força contraeletromotriz induzida é 
ea = Kiw (3.134) 


Em não havendo perdas no motor, a potência elétrica deve ser igual à potência 
mecânica, 


P = Cala = TW (3.135) 
Kittie = Rie (3.136) 
Ky = Ke=k (3.137) 


e, portanto, combinando e rearranjando as equações 3.132 a 3.137, obtém-se 
o modelo do motor DC controlado pela tensão de armadura va, 


dw K 
— = ta 3.138 
dt T PUBS 
dia R K 1 
= is : a 
it po et ze (3.139) 
ou, na forma matricial, 
A B 
FDA Pe 
d| w 0 = Ww 0 
| | ||: |+| | (3.140) 
dt | la | | -¥ = ta t 


Utilizando-se os valores numéricos L = 1H, K = 2Nm4A7!, R = 3Q, 
J = 2kgm? e valt) = 1V para Vt, além da condição inicial w(0) = 1 s71 e 
ia(0) = 0 A, a equação diferencial a ser resolvida é dada por 
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A saída de interesse é a velocidade de rotação do motor, w, 


w(t)=[1 0] E | :t>0 (3.142) 


Para obter a expressão fechada de e^t, necessita-se, inicialmente, determinar 
os autovalores de A, ou seja, as raízes do polinômio 


A(A) = det(AI-A) (3.143) 
= det {| ie we ) (3.144) 
= 24342 (3.145) 
que sao À = —1 e —2. 
Pela metodologia proposta, a expressão para e®^* é 
É 4 10 0 1 
e = ao(t) | 01 + a(t) | ee | (3.146) 


em que os coeficientes a;(t), i = 0,1 são obtidos resolvendo-se 


et = ag(t) + a(t) (—1) (3.147) 
et = a(t) + a(t) (—2) (3.148) 

ag(t) DR mi Ed 8 
a(t) o 1 -2 enat ne) 
E | T | | go | (3.150) 


Logo, a exponencial de matriz desejada é dada por 


| 0 1 |: 
paes ae (ze — E) | A + 
+ (et — e=?) | o E | (3.152) 


2 1| -u -1 —1 | -æ 
Son | ea a | 29 | e (3.153) 
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e a solução do problema de contorno 3.141 é 


| w(t) | ao E: | w(0) | pe E si | o | dr (3.154) 


ia(t) ia(0) 1 
O segundo termo da solução é facilmente calculada notando que 
0 1 
i -| | ot ode 8 et— let_l 
—2 -3 e e e e 
[ e TdT = | e2t “oe 14 e = é | (3.155) 


Portanto, retomando a solução da equação de estados, 


= Je UHE 


I 
ay 
| 
v O 
om 
w 
uo 
+ 
rm 
Ha 
| 
+ 
| 
I= 
m 
ch 
| 
Ha 
fe ai 
N 
aS 
Ha 
ol 
“q 
— 


0 
1,—-2t —t 1 
—5€ “+e +3 

= | ae | (3.158) 


A figura 3.15 apresenta uma comparação entre a resposta do Motor DC obtida 
por simulação da equação diferencial 3.141 e a solução analítica 3.158. Note 
que a velocidade angular tende ao valor 0.5 que corresponde ao ponto de 
equilíbrio 


Pausa para relembrar conceitos importantes: Uma EDO linear e invariante 
no tempo de ordem n pode ser transformado em um sistema de n equações 
de primeira ordem, para o qual é fácil obter a solução explícita. Essa solução 
está relacionada com Equações de Estado, Teorema de Cayley-Hamilton, 
Polinômios de Matrizes, Polinômio Característico, Exponencial de Matriz e 
Autovalores. 
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Comparação entre simulação e solução explícita 


o 
co 


rotação [x 1000 rpm] 
o 
D 
Ei is 
1 
1 
1 
i 
i 


(=) 
e 


o 


Valor de 
Regime 


Simulada | 
| D catculada 


1 2 3 4 5 6 7 
tempo [s] 


Figura 3.15: Comparação entre a resposta do Motor DC obtida por simulação 
e pela expressão analítica. 


3.6 Método da média (averaging) 
Considere um sistema descrito por 
x = ef (x, t) (3.161) 


em que £ é um escalar pequeno (a solução aproximada que se obtém deve 
atender as especificações quanto à acurácia exigida) e f é periódico em t, com 
período T: 

f(x,t +T) = f(x,t) (3.162) 


A ideia no método da média é obter uma solução aproximada utilizando o fato 
que x varia muito mais lentamente do que a variação periódica de f ao longo 
de t. 

x =e (f (x)) (3.163) 


em que 


T 
(£ (0)) 4 F Ferd (3.164) 


Exemplo 


Seja um sistema descrito por 


è = e (—0.52? + xsin? (t)) (3.165) 
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em que z(t) € R para cada t fixo. Neste caso, como f(x,t) é de período 7, 


fr = - [ (0.52? + xsin? (r)) dr (3.166) 
= 0.5 (2-27) (3.167) 


Constata-se que o modelo médio é 
= 0.5 (2-2). (3.168) 
Péndulo de Kapitsa 


Um exemplo interessante é o pêndulo cujo fulcro é submetido a uma vibração 
na direção vertical de pequena amplitude, mas de frequência muito elevada. 


yA 


Leos(q)+acos(@t) ---ț---------------- 


X 
> 


Asin(ot) | 


‘caudal 


Figura 3.16: Pêndulo de Kapitsa. 


Sejam L o comprimento da haste e A a amplitude da vibração da base na 
direção vertical, a(t) = Asin (wt) de modo que A << L. 


Denotando-se g a aceleração da gravidade local, a frequência natural é wo = 
g 


L' 
A frequência de vibração w do ponto de fixação é suposto ser tal que 
w >> wo. O movimento do pêndulo é então descrito por 


LÖ = Aw*sin (wt) sin 0 — gsin (0) (3.169) 
k [rs 
= [Lô — Aw cos (wt) sin J (3.170) 


em que m é a massa, k a constante de atrito viscoso e O o ângulo entre a haste 
e a vertical. 
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Para simplificar a notação, definem-se algumas variáveis auxiliares 


Wo k A 
Q = JA’ = mao E= P’ T=wt 
i E ge Es + cos (7) sin (0) (3.171) 
e dr 


O modelo do pêndulo de Kapitsa é reescrito como 
tt [ne z2 — cos (T) sin (x1) 
io | | —aBxs — a? sin (x1) + cos (x1) cos (7) [x2 — cos (T) sin (x1)] 


(3.172) 
Uma vez que T = wt com w >> wo, pode-se obter o modelo médio calculando 


a 2 
eee = | A E é [ar (3.173) 
| -abr — a? a — tsin (2x1) | (3.174) 


de modo que se chega a 


m 

8: a 

Noe 

Los 
II 


T2 
—aBx2 — a” sin (x1) — $ sin (2x1) 


é interessante observar que o pêndulo pode ser mantido na posição invertida 
(xı = 0 = T), através da vibração vertical do ponto de fixação da haste. 


De fato, o modelo linearizado, para o ponto de equilíbrio (xı = 0 = 7), é 


a (£) 
Ox 


0 1 
= f 3.175 
Gd | a? = 5 —aB | ( ) 


O polinômio característico é dado por 
1 
AM) = AA+ a8) +5 — a’. (3.176) 


Observe que o sistema é estável para 0 < a < a eB>0. 


Exemplo: Conversor elevador de tensão 


O conversor elevador de tensão (conversor boost) possui um elemento comu- 
tador (tiristor ou transistor) que pode estar ligado (ON: u = 1) ou desligado 
(OFF: u = 0). 
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Figura 3.17: Conversor boost. 


O circuito varia estruturalmente de acordo com cada estado do elemento 
comutador. O modelo quando u=1 (chave CH fechada) é dado por 


d/iz|_|-# 0 iz 
dt | vc | 0 0 UC 


Por outro lado, o modelo quando u = 0 (chave CH aberta) é dado por 


alel [E ab Il 
t | ve C Roe | | ve 


Se a chave CH é comutada com período T muito menor do que as cons- 
tantes de tempo do circuito, ficando DT ligado e (1— D)T desligado, o modelo 


médio é 
d | iz -8 0 -Ë -+ iz 
at == D L +(1-D L L + 
Ja JE | JE -o |) | ve 
1 
i | Ys (3.179) 
R 
L 
D 


+ 
1-b _ 1. ij 
C RoC OG 
A figura 3.18 foi obtida mediante simulação numérica e representa a res- 
posta do modelo médio e dos modelos chaveados com frequências de 25 rd/s 
e 50rad/s para o circuito com R=50, L=1H,C=01F e Ro = 102. 
Assumindo que a saida de interesse é Vo, a funcao de transferéncia é 


+ 


1 
| VB (3.177) 


+ 


1 
7 | VB (3.178) 


© js 


| VB (3.180) 


G(s) = cg (3.181) 


1 R 1-D)? 
LC [e+ (ac + R) s+ LO 
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Modelo Médio: Conversor Boost 
T ES: 7 


o pe 
co = N 


o 
a 


Corrente no Indutor [A] 


o 
Eq 


02 


gu o i= — 
0 1 2 3 4 5 6 
Tensão de Saída [V] 


Figura 3.18: Comparação entre a resposta do modelo médio e o modelo cha- 
veado com diferentes frequências. 


O conversor boost é controlado pela manipulação do duty cycle D. Quando 
D = 1 (chave ON) a energia é armazenada no indutor L (o conjunto R + L 
constitui uma bomba de corrente). Quando D = 0 (chave OFF) a energia 
armazenada em L é passada para o conjunto R, + C. Usualmente a ideia é 
medir a tensão de saída Vo = Vo e utilizar uma controlador para ajustar D 
para manter a saída regulada. 

O valor de Vo para uma entrada constante Vg e D fixo, em regime estacionário, 
é dado por 

_—  U-D)Ro 

=- R+(1—D)?Ro 


G(0) (3.182) 


Portanto, pode-se conceber uma lei de controle em que D é ajustado conforme 
a tensão Vo desejada. 


Nota-se, porém, que Vc possui uma dependência não linear com relação a D. 


3.7 Linearização 


Quando o modelo do sistema físico é linear, são disponíveis vários métodos 
efetivos para o projeto do controlador. 


Um enfoque para projetar de controladores é, portanto, obter inicialmente um 
modelo linearizado para o sistema físico. 


Embora existam vários métodos para obter uma aproximação linear para um 
modelo não linear, apresenta-se neste capítulo apenas o método do trunca- 
mento da série de Taylor. Posteriormente serão mostrados outros métodos. 
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0 02 04 06 08 1 
Duty Cycle D 


Figura 3.19: Características de variação da tensão em regime permanente, 
sobre variadas cargas (diferentes cores), em função o duty cycle D. 


Considere um sistema descrito pela EDO da forma 
x = f(x,u) , Kgl =x (3.183) 


em que x(t) € R” e u(t) € R” para t fixo. 


Se u(t) = ug é uma entrada constante, então a resposta xg é dada por 
XE = f(xg, ug) (3.184) 


Adicionando-se uma perturbação Au(t), ou u(t) = ug + Au(t), a resposta 
perturbada 
(xg + Ax) = f (xg + Ax, ug + Au(t)) (3.185) 


que, pela fórmula de Taylor e desprezando os termos superiores, permite es- 
crever 


xp + Ax = f (xp, ug) + Vif (xg, ug) Ax + VTf(xp, ug) Au + o(||Ax, Aull’) 
(3.186) 

Notando que xg = f (xg, uz), 
Ax ~ VIf (xp, un) Ax + VT f(xp, up) Au (3.187) 


para pequenos perturbações { Au, Ax} ou 


Ax ~ A (xg, up) Ax + B(xg, ug) Au (3.188) 
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em que A e B são dadas por 


oh. a gh gi. or ph 

Ti En U1 Um 

A=| i 0: ;B=] Lc: (3.189) 
Ofn .,, fn Om. fn 
da Orn (xp,UE) Our dum (xp;UB) 


Tendo-se projetado um controlador com base no modelo linearizado, a sua uti- 
lização com o processo original requer que o valor nominal de ug seja somado 
com Au e xg subtraído de x. 


No caso de se ter y = h(x), procede-se de modo análogo, fazendo-se Ay = 
Vi h(xz) Ax e subtraindo y de y conforme indicado na figura 3.20. 


Figura 3.20: Estrutura para utilização do modelo linearizado usando a expan- 
são em série de Taylor. 


Estabilidade estrutural 


Alguns modelos não lineares podem ser sensíveis a incertezas paramétricas, 
ainda que estas sejam pequenas. 


Considere o modelo escalar 
=e? -IW+1ty (3.190) 


em que | > 0 é uma perturbação, por exemplo, u = 101º. 
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O ponto de equilíbrio é dado para o valor nominal u = 0 por 


r’ -2+1 = 0 ou (3.191) 
24+/4-4x1 

z= O (3.192) 

Sii (3.193) 


Mas, com a incerteza u = 101º, resulta que 


r’ —2r+1 = 0 ou (3.194) 
2+v4-4 1 10-10 

= v > ee) (3.195) 

= 141075 [complexos) (3.196) 


Neste exemplo, o comportamento do modelo é alterado drasticamente quando 
o parâmetro sofre uma pequena alteração, o que se conhece como o fenômeno 
da bifurcação. 


Mais especificamente, nesse modelo, uma pequena variação de u afeta a exis- 
tência ou não do ponto de equilíbrio. 

O fenômeno apresentado é conhecido na literatura como bifurcação sela-nó 
(saddle-node, fold ou tangencial bifurcation). 


Aa = vVIf(zu)Av+ VI f(T,u) Au (3.197) 
= 047437] Au (3.198) 
= 0 (3.199) 


3.7.1 Validade dos modelos linearizados 
Sistemas topologicamente conjugados 


Em muitas aplicações, o modelo linearizado aproxima bem o comportamento 
do modelo não linear em uma vizinhança suficientemente pequena do ponto 
de equilíbrio. 

Porém, nem sempre isso é verdadeiro. 


Para estudar de forma mais aprofundada o tema, introduz-se o conceito de 
modelos topologicamente conjugados. 


Considere 2 modelos, cada qual descrito por 
x(t) = f(x(t)) (3.200) 
z(t) g(z(t)) (3.201) 
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em que x(t) € R” e z(t) € R” para t E€ R. 


Assuma que ambos, 3.200 e 3.201, possuem soluções x(7) e z(T) para 7 € [to, t) 
com t > 0. 


Os sistemas 3.200 e 3.201 são ditos topologicamente semiconjugados se para 
algum X C R” e Z c R” abertos, existe uma aplicação bijetorah: X > Z tal 
que 

hof=goh (3.202) 


ou h(f(x)) = g(h(x)). 
De modo intuitivo, as soluções de 3.200 podem ser obtidas a partir daquelas 
de 3.201 por “deformações” caracterizadas por h e vice-versa. 


Uma função contínua h com a inversa h~! também contínua é chamada de 
homeomorfismo. No caso de h ser homeomórfica, diz se que os modelos 3.200 
e 3.201 são topologicamente conjugados. 

Exemplo: Sistemas lineares 


Considere os sistemas lineares 


x = Fx (3.203) 
Zz = Gz (3.204) 


em que F e G são matrizes n x n. 


Os modelos 3.203 e 3.204 são topologicamente conjugados se, para Fnxn, 
F =H GH (3.205) 


ou seja, são relacionados por uma transformação similar (mudança de base). 


Para se estudar um sistema utilizando um modelo linearizado, deseja-se que 


x = f(x) (3.206) 
Ax = A(xz) Ax (3.207) 


sejam topologicamente conjugados em uma vizinhança do ponto de operação 
XE. 

Antes de apresentar o teorema de Hartman-Grobman, é necessário definir o 
que é um ponto de equilíbrio hiperbólico. 

Um ponto de equilíbrio xg em torno do qual se fez a linearização é dito ser 
hiperbólico se nenhum autovalor de A(x) possuir parte real nula (ou não 
esteja sobre o eixo imaginário). 
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Teorema de Hartman-Grobman 


O teorema de Hartman—Grobman (1959/1960), também conhecido como o te- 
orema da linearização, permite caracterizar o comportamento local de sistemas 
dinâmicos na vizinhança de pontos de equilíbrio hiperbólicos. 


Seja x(t) € R” a solução de x = f(x) para um mapa suave (smooth) f : 
R” > R” e xg um ponto de equilíbrio hiperbólico. Então existem vizinhanças 
X(xz) CR” e Z(0) c R” e um homeomorfismo h : X > Z tais que 


1. h(xg) = 0, 
2. hof = Ach em que x = f(x) e Ax = AAx. 


Logo o modelo original (x = f(x)) e o linearizado (Ax = AAx) são topologi- 
camente conjugados. 


Um resultado imediato é que se todos os autovalores da matriz Jacobiana 
A(xz) = Vif(xg) possuem a parte real negativa, esse ponto de equilíbrio 
hiperbólico xz é estável. 


Esse procedimento para verificação da estabilidade é conhecido como o “pri- 
meiro método de Lyapunov” (ou o “método indireto de Lyapunov”). 


Em problemas de controle existem, em geral, variáveis manipuladas (aqui de- 
notadas u e v). 


Considere 2 modelos descritos por 


x(t) = f(x(t),u(t)) (3.208) 
z(t) = g(z(t),v(t)) (3.209) 


em que x(t) € R”, u(t) € R”, z(t) € R” e v(t) € R” para t E€ R. 
Assuma que dado u(t), 3.208 e 3.209 possuem solução (x, u) € X C R” x R” 
e (z,v) € ZC R” xR”. 


Novamente, deseja-se fazer a associação 


z(t) = g(z(t), v(t)) e» Ax = A(xp up) Ax + B(xp, Up) Au, (3.210) 


com o intuito de projetar leis de controle utilizando modelos linearizados. 


Caso de controle realimentado (u(x), v(z)) 


Se as leis de controle são do tipo realimentação de estado u(x) ou de saída 
dada por y = I(x) que leva a u(y) = u(l(x)), recai-se no caso anterior e o 
teorema de Hartman-Grobman é aplicável. 
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Caso de u(t) gerado por uma EDO 


Considere um processo modelado por 


x(t) = £(x(t),u(t)) (3.211) 


u(t) = g(x(t), u(t)) (3.212) 


Tomando-se o estado aumentado x, = [x7 u”]”, pode-se colocar 3.211 e 3.212 
na forma 


Xa(t) = fa(xa(t)) (3.213) 


e o teorema de Hartman-Grobman pode ser utilizado. 


Contraexemplo 


Considere o sistema escalar 


t = f(x,u) (3.214) 
= u’ (3.215) 


O modelo linearizado no ponto (xp, xp) = (0,0) é 


Ac = Vi f(xp,ug)Ac+ Vif (rg, uz) Au (3.216) 
= 0Azr+3 uz] q Au (3.217) 

ug= 
= 0 (3.218) 


Aqui, a partir de um modelo controlável obteve-se um modelo linearizado não 
controlável. 


3.8 Estabilidade de sistemas LTI 
Um estado xp é dito ser ponto de equilíbrio de 
x(t) = f(x(t), t) (3.219) 


se x(to) = xg implica que, para Vt > to, tem-se que x(t) = xp. 
Intuitivamente, o ponto de equilíbrio é aquele em que x = O ou, em outras 
palavras, f(xg, t) = 0. 
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Para o caso particular de sistemas LTI SISO com a representação 


x = Ax+Bu (3.220) 
y = Cx (3.221) 


e entrada nula u(t) = 0, tem-se um único ponto de equilíbrio xg = O se A for 
não singular. 


Os estudos dos casos de u(t) O ou de quando A é singular são deixados como 
exercício. 


Um ponto de equilíbrio xp é dito ser estável se, dado £ > 0 arbitrário, 3ô(€) > 
0 tal que 
||x(to) — xg|| < êle) > ||x(t) — xg|| < e,Vt > to. (3.222) 


Um ponto de equilíbrio xg é dito ser assintoticamente estável se é estável e 
existe ô > 0 tal que 


\|x(to) — xp|| < 6 > ||x(t) — xgl|| | 0 para t t 00 (3.223) 


Um ponto de equilíbrio xp é dito ser globalmente exponencialmente estável se 
da, > 0 tal que para Vx(to) 


Ibe(t) — xgl| < a||x(to) — xgl|e7™ ; Vt > to (3.224) 


Sistemas LTI SISO são ditos globalmente assintoticamente estáveis (com certo 
abuso de linguagem, pois estabilidade é propriedade de pontos de equilíbrio) se 
todos os autovalores da matriz de sistemas Aņnxn (ou, equivalentemente, todas 
as raízes A% do polinômio característico A(A)) possuem parte real negativa, 
pois 


x(t) = S Mye™ (3.225) 
k=1 
y = Cx(t) (3.226) 


se u(t) = 0. 

No domínio transformado, tal fato se traduz na condição de que todos os 
polos da função de transferência estão localizados estritamente no semiplano 
esquerdo. 


Existem vários critérios que permitem verificar se todos os polos da função 
de transferência estão localizados estritamente no semiplano esquerdo, sem a 
necessidade de calculá-los. Alguns desses critérios serão apresentados em um 
capítulo próprio adiante. 
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3.9 Controlabilidade 
Considere um sistema LTI de dimensão n descrito por 
x — Ax + Bu (3.227) 


com a condição inicial x(0) = xy conhecida. 
A representação 3.227 é dita ser controlável se, dado um ponto qualquer xy 


no espaço de estados, existe u(t), t € 0, ty], tr > 0, tal que 
Xf = x(t) (3.228) 


ou seja, existe uma lei de controle u(t) que leva um estado xo a um outro xy, 
ambos arbitrarios. 


Levando-se em conta a expressão da solução da equação diferencial 3.227, a 
fórmula que expressa a transferência de x(0) = Xo para x(t) = xy é 


ep 
x, = eAlfxg+ St Bu(r) dr 


(3.229) 


II 
o 
> 
a 
n 
x 
(=) 
l 
S= 
oF 
a 
S, 
> 
q 
os 
RE, 
a 
a 
4 
NS 


ou, introduzindo a notação Ax = eAtix, — Xo, a equação 3.229 é reescrita 
como 


Ax = e Mixi- xo (3.230) 


t 
f É ec“ Bu(7) dr (3.231) 
0 


A tarefa é obter u(t) de modo que a equação 3.231 seja satisfeita. Ressalta- 
se que a solução não é única, pois pode-se transitar de xo a xf percorrendo 
caminhos diferentes e que correspondem a u(t) distintos. 


Propõe-se a seguinte lei de controle 
u(t) = BT A 'Wo(o, tj) 1Ax (3.232) 
em que a matriz W(0,ty) é definida por 
t2 
We(ti, to) 2 f e ATBB? eA"? dr (3.233) 
tı 


Assuma que W(t, t2), chamada de gramiano de controlabilidade, é inversí- 
vel. 
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Substituindo-se a lei de controle proposta, a expressão à direita de 3.231 se 
torna 


ty tf 
ce“ Bu(r)dr = e ATBBl eA Wo 0,t¢) TAx dr(3.234 
0 0 É 
t 
= | * e-ATBBT eA" dr Wo (0, tp) 1 Ax(3.235) 
0 


SE => 
Wc (Ots) 


= Ax (3.236) 


que é o resultado desejado, notando que Wc (0, tp) (Aik — xo) foi posto 
para fora da integral por este não depender de 7. 


Portanto, caso Wc(ty,t>) definido em 3.233 seja uma matriz invertível para 
tı # to, é possível transitar de xo a xf e, consequentemente, o sistema é 
controlável. Resta verificar se há uma forma simples de verificar se Wc(ty, t2) 
é invertível. 


Ao invés de uma prova formal, será mostrado que um critério simples para 
verificar a controlabilidade é testar se 


o(|B:AB:...: A" 1B] |) =n (3.237) 
(I ) 


em que p(M) denota o posto da matriz. 
De fato, substituindo-se a expressão da exponencial 3.122. 


e AT = ag(r)I + ay(T)A +... + an1 (T) A”! (3.238) 


na expressão da gramiano de controlabilidade em 3.233, tem-se que 


t2 T 

Wol(ti,t2) = / e ATBBl eA Tdr 3.239 
c(ti, te) n SZ (3.239) 

t2 
— O08! dr (3.240) 

ty 

em que 

S = ap(7)B + a(T)AB+... + Gn_1(7)A” 'B (3.241) 


Logo, a não singularidade de Wc(ty, t2) está relacionada com a não-singularidade 
de & que, por sua vez, depende do posto de U = [B :AB:..: AB]. 


Detalhes de uma prova completa podem ser encontrados em (CHEN, 1970), 
(HESPANHA, 2009) e (KAILATH, 1980), entre outros. 
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O caso de Wc(0,00) 


Para o cálculo de Wc quando o processo é estável e invariante no tempo, note, 
inicialmente, que 


d 
ao = Ae*t (3.242) 
que permite escrever 
e (e^ BBT e^t) = Ae^BBT e^ + ABBTeA AT (3.243) 


Integrando esta expressão, e lembrando da hipótese de que A é estável 


-BBT Wc Wo 
——<$ ~~ aao a 
AtppT ATE ®© AtppT ATt ®© AtppT Arty AT 
e^tBBTe GA cAtBBT Ata + | MBBTA a AT (3.244) 
0 0 
constata-se que 


AWc + WcA" + BB! =0 (3.245) 


Exemplos de verificação da controlabilidade 


Considere o exemplo do motor DC, representado por um modelo no espaço de 
estado com dimensão n = 2 


0 1 0 
x | cos ie ee E (3.246) 
A B 
ps OO je (3.247) 
ee y 
(0; 
e que corresponde à função de transferência 
Ys) _ C(sI-A)'B (3.248) 
U(s) 
ai 
s -—l 0 
apa es 
1 
= o o-s 3.250 
s2+38+2 ( ) 
A matriz U calculada a partir de {A,B} é 
U = |B AB] (3.251) 


0 1 
= k E) (3.252) 
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e esta representação do motor DC é controlável uma vez que p(U) = 2. 


Considere uma outra representação do mesmo motor DC, agora com o espaço 
de estados de dimensão 7% = 3. 


00 -6 3 
x = [10 -11|/x+]1]u (3.253) 
01 -6 0 
e ~ 
p= [06 i x (3.254) 
—— 
6) 


que resulta na mesma função de transferência que 3.250, mas agora empre- 
gando {A, B, C} em 3.253 e 3.254 


s 0 6 | 13 
Y 
ae = [o01[[1s u 1 (3.255) 
(5) 0 —1 #46 0 
s+3 1 


E (s+ 1)(s+2)(s +3) ~ 2 +3842 (3.255) 


O fato de uma representação no espaço de estados de dimensão 3 resultar 
em uma função de transferência de ordem 2 está relacionado com o fato de 
existirem componentes que ou não recebem entradas, ou não produzem saídas. 


No caso da representação {A, B, C}, tendo-se em vista que 


C 
3 0 

p([B: AB: A’B)) = 1 3 “1 =2<3=7 (3257) 
01 


conclui-se que ela não é controlável. Mais detalhadamente, o cancelamento de 
(s +3) na expressão 3.256 indica que o modo e~* não é afetado por u(t). 


3.10 Observabilidade 


Por outro lado, seja um sistema LTI de dimensão n descrito por 


= Ax+ Bu, (3.258) 
y = Cx, (3.259) 
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com a condição inicial x(0) = xo desconhecida. 


A representação é dita ser observável se as entradas u(t) e saídas y(t) são 
conhecidas em um intervalo [ty, t2], ti Æ t2, então é possível estimar o valor de 
Xo. 

Sabendo-se que a solução do sistema de equações 3.258, 


t 
y(t) = Ce^txo + | CeA“) Bu(r)dr (3.260) 
0 


ou seja, 


t 
Ce**xy = y(t) — J CeAt-7)Bu(r)dr (3.261) 
0 


eee eee” 
y(t) 


em que o termo y(t) é conhecido. 
Infelizmente, Ce“! não é, em geral, invertível mesmo em casos em que a matriz 


Si 
C é quadrada n x n, o que não permite escrever xy = (CeA*) y(t), para 


algum t. 
Multiplicando-se a equação 3.261 pela esquerda pelo termo MCT, obtém-se 
que 
eA™*CTCeAtxy = MCT, (3.262) 
que, integrado entre 0 e t > 0, leva a 
t Air ATtAT 
f e^ TC Ce" dr xo = e" C y (3.263) 
0 


Definindo-se a matriz gramiana de observabilidade Wo(t1, t2) , no caso geral, 
por 


Wolt, t2) Ê f PATCTCeArdr (3.264) 
1 
a expressão 3.263 se torna 
Wo(0, txo = e *CTy (3.265) 
e, se Wo(t1, t2) for inversível para ty to, 
xo = Wo(0, t)e® CT (3.266) 


A invertibilidade de Wo(t1, t2) pode ser verificada se 


p(V)=n (3.267) 
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em que 


CA 
V= l (3.268) 


CAT 


conforme argumento análoga utilizado no caso de controlabilidade, ou seja, 


t2 
Wolti,t2) = f eA'TCTCeA dr (3.269) 
1 
wv 
t2 
= pi pdr (3.270) 


tı 


Exemplo de verificação da observabilidade 


Considere o exemplo do motor DC, representado por 


0 1 0 
k= È Ta ee a (3.271) 
B 
y = [1 0 |x (3.272) 
eS 
C 
para o qual 
C 
V = EN (3.273) 
10 
= E | (3.274) 


cujo posto é 2. Logo, esta representação do motor DC é observável. 


Os critérios para a verificação de controlabilidade e de observabilidade são 
essenciais em um projeto, uma vez que, no projeto de controladores de ma- 
lha fechada, a variável manipulada u pode depender direta ou indiretamente 
da saída y. Na literatura podem ser encontrados outros critérios de contro- 
labilidade e de observabilidade (vide, por exemplo, (HESPANHA, 2009)). 
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3.10.1 Decomposição de Kalman 


O modelo de um sistema 


x = Ax + Bu (3.275) 
y = Cx + Du (3.276) 


pode ser reescrito, através de uma transformaçâo similar apropriada X = Px, 
na forma 


d | Feo Aco Ar Ass Xco Boo 
al xco;=|] 0 Aco Ass Xco | + | Bco |u 
XGo 0 0 Azo XGo 0 


A decomposição de Kalman leva a 4 blocos indicados por: CO = controlável e 
observável, CO = controlável mas não observável, CO = não controlável mas 
observável, CO = não controlável nem observável. 


Z 


O bloco CO nao é representado em 3.277 porque nao recebe entradas nem 
produz saídas, de forma que, se for estável, não afeta o projeto do controlador. 


3.10.2 Redução de modelos 


Nesse módulo é tratado apenas o método de redução de modelos utilizando 
balanceamento dos gramianos de controlabilidade e de observabilidade. 


Modelos balanceados são aqueles em que os gramianos de controlabilidade e 
observabilidade são iguais e diagonais. 


Transformações similares podem tornar modelos não balanceados em balance- 
ados. 


Z 


O balanceamento é útil, por exemplo, na redução de modelos, pois fornece 
informações sobre os ganhos relativos de um canal em relação a outro. 


Considere um processo descrito por 


x 


Ax+Bu (3.278) 
y = Cx+Du (3.279) 


e seja a transformação similar 
x = Tz (3.280) 
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Notando que x = Tz e que z = T~! x, 


A B 
a, pa, 
2 = T'ATz+T'Bu (3.281) 
C 
20 
y = CTz+Du (3.282) 


Usando a expressão 3.245, e multiplicando por T pela esquerda e por TOT 
pela direita, obtém-se que 


AW+WA’+BB’ = 0 (3.283) 
TOATW+WT7ATT7+T'!BB'T = 0 (3.284) 
ee 
A TWT? + TWT? AT +BB? = 0 (3.285) 
Logo, T transforma W segundo 
W=T WT (3.286) 
Analogamente, para o gramiano de observabilidade, tem-se 
A'V+VA+C7C = 0 (3.287) 
TAT TŪ + VTAT + TIO CI 0 (3.288) 
v v 
= EE TE 
AT TTVT! + TTVT!A+CTC = 0 (3.289) 
e, portanto, 
V = TVT (3.290) 
O objetivo é buscar T de modo que 
V=W=A (3.291) 
em que A é diagonal 
O71 
A= Es (3.292) 


On 


Uma forma de obter T é através da decomposição em valores singulares (SVD 
- Singular Value Decomposition). 


: ; À 1 1 À 
Sejam as matrizes raiz quadrada W2 e V2 de W e V, respectivamente, que 
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pode ser obtida via decomposição de Cholesky (vide, por exemplo, (BERNS- 
TEIN, 2009)). 

(3.293) 
(3.294) 
Através da Decomposição em Valores Singulares (SVD) da matriz Viw:, 


obtém-se N e M roa 
V2W2 = MANT (3.295) 


em que MTM = I e NTN =I (ou seja, Mt = MT e N“! = NT). 
Observando em 3.295 que A = MTVSWIN a transformaçâo buscada é 


T= WNA? = VMA? 


De fato, notando que (XY)? = (Y7X7)-1 = (xt) (vn) 


~ 


W = TIWTT (3.296) 
= AM VSWVIMA 2 (3.297) 
MANT NAM” 
1 T 1 T 1 1 
= AM! V2W2W2V?2 MA (3.298) 
= A`MTMANTNAMĪMA ? = A (3.299) 
Analogamente para V, 
V = TVT (3.300) 
= ANTWIVWINA >? (3.301) 
NAM” MAN” 
e o 
= ANT W2V2V2W?2 NA? (3.302) 
= A éNTNAMPMAN'NA 2 = A (3.303) 


Os passos para balancear um modelo no espaço de estados são 


e determinar W e V (AW + WAT +BB" = 0 ou A7V+VA+C7TC =0 
e por SVD obter M e N tal que V2W2> = MANT 


e a transformação similar buscada é T = WNA? = V-2MA? 


Uma vez que o sistema está balanceado, ordena-se o conjunto (A, Ao, ..-An} 
e os estados associados a A; menores (informalmente, mais “fracamente” con- 
troláveis e observáveis) são descartados. 
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3.11 Simulação de sistemas dinâmicos 


Conforme foi visto, EDOs lineares admitem solução fechada. Porém, em geral, 
esse não é o caso de modelos não lineares. Nesses caso, a simulação pode ser 
um enfoque útil. Em uma primeira avaliação de se um modelo linearizado e 


eventualmente reduzido se aproxima do processo físico real, pode-se fazer uma 
comparação com um modelo mais completo, eventualmente não linear. 


No passado eram utilizados computadores analógicos, hoje superados pelos di- 
gitais. Na simulação analógica, a integração era realizada por amplificadores 
operacionais, enquanto na simulação digital a integração é realizada numerica- 
mente, utilizando, por exemplo, o algoritmo Runge-Kutta (vide, por exemplo, 
(BLUM, 1972)). 

A ideia básica é simples e consiste em representar (t) através de blocos mate- 
máticos e de roteamento de sinais, de modo que na saída do bloco integrador 
seja obtido x(t). 

Com o intuito de apresentar uma forma de realizar uma simulação digital de 
sistema dinâmico representado por uma equação ordinária, considere a equação 
de Van der Pol controlada 


t-ul-s)p+r= (3.304) 


A equação 3.304 pode ser reescrita de modo que seja expressa em termos de 2 
integradores independentes, fazendo-se 71 = x e X2 = &, obtendo-se 


ti = T2 (3.305) 
čo = p(l- z?)r— zı +v (3.306) 
Como pode ser visto na figura 3.21, para o caso particular da equação de Van 


der Pol controlada, basta que se alimente cada bloco integrador com sinais ¢ 
apropriados. 


3.11.1 Solução utilizando transformada de Laplace 


Os sistemas do tipo LTI podem ser estudados mediante o emprego da trans- 
formadas de Laplace, visto que são representados por equações diferenciais 
ordinárias lineares com coeficientes que não variam com o tempo. 


A transformada de Laplace é definida por 


F(s) LIFO] (3.307) 


f i O (3.308) 
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Figura 3.21: Exemplo de diagrama de simulação: equação de Van der Pol. 


possui a propriedade 

df 
dt 
Aplicando-se a transformada de Laplace aos dois lados da equação de estados 


Li (t)| = sF(s) — f (0) (3.309) 


x= Ax + Bu (3.310) 
obtém-se que 
Lx) = L[Ax+ Bu] (3.311) 
X(s) -x(0) = AX(s) + BU(s) (3.312) 
a — A)X(s) = x(0)+BU(s) (3.313) 
X(s) = (sI- A) !x(0)4+(sI- A) BU(s) (3.314) 


Notando que y(t) = Cx(t) + Du(t), a versão transformada da saída Y(s) = 
Lly(t)] é dada por 


Y(s) = C (sI — A) x(0) + (C (sI — A)! B + D)U(s) (3.315) 
S——— aM 
G(s) 


A expressão 
Y(s) 1 
G(s) = —~ = C(sI - A) B+D 3.316 
(9) = tio = OCI- A) (3.316) 
é denominada de função de transferência do sistema e representa, no dominio 
transformado “s”, uma relação entre as grandezas de entrada e a saída. 


A função de transferência é dita ser uma representação externa de um sistema 
(ou seja, envolve apenas u e y), enquanto as equações de estado são ditas 
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serem representações internas (envolvem também x). 


Para simplificar a notação, considera-se a partir desse ponto, sistemas SISO, 
de modo que G(s) é 1 x 1. 


No caso de x(0) = 0, a relação entrada-saída é um mero “ganho” 
Y(s) = G(s)U(s) (3.317) 


e, portanto, no domínio transformado, podem-se empregar representações tipo 
grafos como o fluxograma ou fluxografo (MASON, 1956) . 


A função de transferência é uma razão de polinômios (ou uma matriz com 
razões de polinômios G;;(s) no caso multivariável, da forma 


Gls) = Di) (3.318) 
o K (s™ + bs" 1 +-..+bm) 

CC gh + bysP-1 4-4 bn (3.319) 

K (s—@)--:(8 — Gn) Es 


(s — m1) (Ss — Tn) 


em que ¢; são chamados de zeros e mj de polos do modelo. 


De posse de Y(s), a função de saída y(t) pode ser recuperada através da 
transformada inversa de Laplace 


y(t) =L"[¥(s)] (3.321) 


1. £71 [d(t)] = 1 (delta de Dirac) 
2. L7! [u(t)] = + (degrau unitário) 


a oe [e=] =i 
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3.11.2 Exemplo de transformada inversa de Laplace 
Seja um processo cujo modelo é descrito no domínio transformado por 


2s+1 


= — 322 
Gy) s2+5s+6 (3.322) 
e a excitação é um degrau unitário U (s) = 1/s. 
A saída Y(s) é dada por 
yt) = £[¥(6)] (3.328) 
= L£[G(s)U(s)] (3.324) 
2s+1 1 
= fe 32 
cla | ee) 


Para obter a expressão da transformada inversa, utiliza-se a expansão em 
frações parciais, 


[26546 5] 


ri T2 T3 
~ — L 3.326 
s2 +5s+6 8 | Lê $ | ( ) 


s+2 s+3 s 
em que r1, r2 e r3 devem satisfazer a identidade 


2s+1 1 ri r2 T3 
— 3.327 
s2+5s+6 s Per gg a ( ) 


Existem métodos práticos para obter r1, r2 e r3, sem necessitar a solução de 
um sistema de equações. 

Um tal método é multiplicar o denominador associado a r; em ambos os lados 
da equação 3.327. 


Para o caso particular de obter rz, multiplicam-se ambos os lados de 3.327 por 
(s +3) 


2s +1 1 r r 
(s437 = — (s +3) + — 


T3 
(s +2) [s43] s 342 e i eee na (3.328) 


Fazendo a substituição s = —3, tem-se que 


5 ri 0 r3 0 
T3 = = +19 to De (3.329) 


Usando o mesmo procedimento para obter rı e r3, pode-se expressar a saída 
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como 
2s+1 1 
t) = £L£/5——. - 3.330 
y(t) Es ( ) 
5 3 1 
= L|— 2 6 3.331 
E +2 s+3 H s ( ) 
5 1 
=F 1.5 = 
= L|— L| 3.332 
s+2 |: + 5 = ( ) 
5 x, 3-a, 1 
= —> = -=1(t 3.333 
eT? + Se + (0) (3.333) 
Relações entre os Domínios t e Transformado s 
Retomando o exemplo do motor DC, tinha-se que 
0 1 0 
a=] 5 HEHEA o | (3.334) 
Da expressão 3.315, 
Y (s) =C (sI — A)~'x(0)+ C(sI— A) BU(s) (3.335) 
em que 
i = 
-1 S = 
C(I-AJ! = [1 J|; na (3.336) 
3 1 
Es | na AE s2+3s+2 ] (3.337) 
e 
i -1 
| = S = 
C(sI-A)'B = [1 aE Ra (3.338) 
3 1 0 
| Jon s?+3s+2 | | 1 | (3.339) 
1 
= = 3.340 
s2+3s+2 ( ) 
Portanto, para o motor DC, a relação entrada-saída é dada por 
1 
+3 1 
s 3243842 | x (0) + agaa i] (3.341) 


Y (s) = | s2+3s+2 
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Seja agora uma entrada do tipo degrau unitário 


u(t) = ; o (3.342) 


cuja representação no domínio transformado é 


U(s) = Llu(t)] (3.343) 
= f e *Tu(r)dr (3.344) 
0 
= J E dr (3.345) 
0 
S (3.346) 
Slo 
= : (3.347) 


T T 
No caso particular de condição inicial | w(0) ial0) | = | 1 0 | e entrada 
degrau unitário, U(s) = 1/s, a expressão 3.341 permite escrever a resposta 
Y (s) como sendo 


1 1 1 
+3 1 
Y(s) = | 43550 Fe | | 0 | + 435405 (3.348) 


s2+3s+1 
= —______ 3.349 
s(s+1)(s +2) ( ) 


e, portanto, y(t) pode ser obtido pela transformada inversa de Laplace 


s2 +3s+1 
p=" Ara 3.350 
y(t) s(s + 1)(s +2) ( ) 
Expandindo Y (s) da expressão 3.349, tem-se que 
2 
s +38 +1 Ti r2 r3 
= 3.351 
s(s+1)(s +2) E CR ao 
= (rı + r2 + r3) s? + (314 + 2r9 + r3) s+2rı (3.352) 
s(s+1)(s +2) 
Igualando-se os numeradores em 3.351-3.352, 
rı +r +r3 = 1 (3.353) 
3rı + 2r +r3 = 3 (3.354) 


ar, = 1 (3.355) 
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ou rı = 1/2 , r2 = 1 e r3 = —0.5, de modo que 
N 
t)=L7 3.356 
y(t) Et ( 


Consultando uma tabela de transformadas inversas de Laplace (disponível, 
por exemplo, em (DORF; BISHOP, 1995), (OGATA, 1970), (FRANKLIN; 
POWELL; EMAMENAEINI, 1986), (KUO, 1980)), constata-se que 


om E : -| = ret (3.357) 
e, pela linearidade aplicada à expressão 3.356 
1 a 1 y 
y(t) = w(t) = 3 +e°— zE (3.358) 


que coincide com o resultado obtido anteriormente (primeiro componente da 
expressão 3.158). 


Observação 1: Em casos em que há atrasos puros de T unidades de tempo dos 
sinais, a função de transferência pode apresentar termos tipo exp(—Ts), visto 
que 

LIF- T] =e" (3.359) 


que é também do tipo polinomial, caso se interprete como 


1 1 
is = fel ye e sa (3.360) 


Observação 2: Considere a função f(t) = e“ em que a > 0. A transformada 
de Laplace de f(t), pela definição, é dada por 


F(s) = 1 et f(t) dt (3.361) 
0 

= 1 e te dt (3.362) 
0 

= f ere at (3.363) 
0 


Na região em que (Re{s} + a) > 0, ou seja, Re{s} > —a , a integral converge 


Fs) = - - - (3.364) 


O semiplano caracterizado por Re{s} > —a é chamado de região de conver- 
gência (Region of Convergence - ROC). 
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Logo, para obter a transformada inversa, o caminho da integração (o — joo) > 
(o + joo) em 


CFs) = — lim © e “F(s) ds (3.365) 


deve ser tal que o > —a. 


A expressão em 3.365 é chamada de Integral de Bromwich ou Fórmula de 
Mellin (DOETSCH, 1974). 


A transformada de Laplace permite representar a relação entre a entrada 
u(t) e a saída y(t) que envolve uma integral de convolução como um simples 
ganho G(s) no domínio transformado, Y(s) = G(s)U(s). A função de 
transferência G(s) pode ser calculada de modo muito simples, G(s) = C(sI— 
A) 1B+D, bem como a sua inversa através da expansão em frações parciais. 


3.11.3 Resposta a Impuslo t e s 


Tanto as soluções obtidas no domínio t quanto no domínio transformado s são 
representações do mesmo sistema e devem estar estreitamente relacionadas. De 
fato, considere uma entrada u do tipo impulsivo, ou seja, u(t) = ó(t) (função 
delta de Dirac ou, mais rigorosamente, função generalizada ou distribuição de 
Dirac). 

Considerando o fato (vide, por exemplo (ZEMANIAN, 1965)) 


/ i f(r)6(7)dr = F(0) (3.366) 
obtém-se de 3.108 para o caso x(0) = 0 e u(t) = ô(t) que 
y(t) = Cx(t) (3.367) 
= CeA'x(0)+ f i CeAt-Bu(r)dr (3.368) 
= i: CeA-Ba(r)dr (3.369) 
= CAC OB (3.370) 
= CeB (3.371) 


A resposta a uma entrada impulso é denotada por 


A 


g(t) = y(t)|,-5 = CB (3.372) 
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para t > 0, supondo o sistema inicialmente em repouso. 


Uma outra maneira de expressar compactamente a resposta impulso é 


g(t) = Ce™B x 1(t) (3.373) 
em que o sinal degrau unitário é definido por 
1:t>0 
1(t) = i 0 :t<0 (3.374) 


Essa necessidade de incluir a condição t > 0 decorre do princípio da cau- 
salidade, ou seja, para indicar a ausência da resposta antes da aplicação da 
excitação de entrada, que no caso ocorre em t = 0. 


Assumindo-se que u(t) = 0, para t < 0 pode-se notar que 


Hey = | “CACNB u(r)dr (3.375) 
= a i datado (3.376) 
= [|gxu](t) (3.377) 


em que [f * gl(t) denota a convolução entre as funções f e g, de modo que, 
usando a propriedade L[[f * gl(t)] = F(s)G(s), permite escrever 


Y(s) = G(s)U(s) (3.378) 


Portanto, G(s) é a transformada de Laplace da resposta a impulso g(t). 


E interessante lembrar, ainda, que o polinômio característico da matriz Anxn 
é o polinômio de grau n dado por 


A(s) = det(sI — A) (3.379) 
e que coincide com o denominador da função de transferência 
G(s) = C(sI- A) IB (3.380) 
1 
= C |—— adj(sI— A)| B 3.381 
det(sI — A) agi ) ( ) 
1 
= —— (sI— A)B 3.382 
ag E Mist A) (3.382) 


Portanto, os polos de um sistema são números complexos que anulam o deno- 
minador de G(s) e coincidem com os autovalores de A. Além disso, constata-se 
que, na ausência de entradas (u(t) = 0), a saída do sistema é uma soma ponde- 
rada de exponenciais e^t, ..., eAnt, chamados de modos. Lembrar que, quando 
há autovalores com multiplicidade maior que 1, por exemplo, se A; possui 
multiplicidade k, então surgem termos te^:t 
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Os autovalores da matriz A são também raízes do polinômio característicos e 
polos da função de transferência. A função de transferência é a transformada 
de Laplace da resposta impulso. Para entrada nula, a saída de um sistema 
LTI é uma soma de exponenciais com pesos dependentes da condição inicial. 
Em suma, equações de estado e funções de transferência se relacionam pelo 
conjunto de números complexos que são os autovalores da matriz A ou os 
polos do G(s). 


3.12 Sistemas de segunda ordem 


Um sistema de grande importância prática é o de segunda ordem (ou grau). 
A função de transferência de um sistema de segunda ordem LTI genérico é da 
forma 


b 
G(s) = —————— 3.383 
DO Ea) (3.383) 
Porém, é muito conveniente reescrever 3.383 na forma 
ww 
G(s) = z (3.384) 


s2 + 2€wns + w2 


pois os polos ficam descritos por 


—2twn + /4E2w2 — 4w2 (3.385) 


2 


4 MZunstu2 = 0 => s = 


e no caso de 0 < € < 1 os polos são complexos conjugados e dados por 


s = —bwy + jwn4/ 1 — E? (3.386) 


sendo denotados frequentemente na forma 


—o + jwa (3.387) 
É = Ghia (3.388) 


wa = wn/l-— é (3.389) 


Os parâmetros € e wn possuem interpretação física imediata e são chamados, 
respectivamente, de coeficiente de amortecimento e frequência natural. 


A obtenção de é e de wn, a partir de a e b em 3.383, é imediata notando que 


b w => wn = Vb (3.390) 
a a 
i a o 
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Im{s} 


Ed x -------------- joa =jonsin(p) 


Lugar Geométrico 
de € = cos(p) = cte 


Re{s} 


-jo =joncos(p) 


Figura 3.22: Relação entre as partes real e imaginária de polos complexos 
conjugados de um sistema de segunda ordem. 


Como foi visto anteriormente, a resposta de um sistema LTI que possui um 
polo em p apresenta termos (modos) tipo e? na saída. 

Como a matriz A em x = Ax + Bu é real, o polinômio característico A(s) 
possui coeficientes reais, de modo que, se um número complexo s é raiz de 
A(s) = 0, então o seu complexo conjugado 5 também o é. 


Portanto, a saída apresenta termos e tHIvwat 


tório sin(wat + @) com envoltória e7%. 


, ou seja, um componente oscila- 


Graficamente, a resposta de um sistema de segundo grau a uma excitação do 
tipo degrau unitário (3.374), quando 0 < é < 1, apresenta a forma vista na 
figura 3.23. 
A resposta a um entrada degrau de um sistema linear de segunda ordem pode 
ser bem caracterizada através de dois parâmetros, mais especificamente, é e 
Wy. 
Introduzindo a notação 3 = cos”! (£) tem-se que a resposta degrau apresenta 
como grandezas notáveis o tempo de subida (rise time) 

(a=) 


tr = =—— 3.392 
= (3.392) 


e o sobressinal (overshoot, sobressinal, sobrepasso, ultrapassagem) 


E 
= 
Dadas as especificações de sobressinal (Mp) e tempo de subida (tr), os valores 
de é e wn podem ser obtidas aplicando-se as expressões 3.393 e 3.392, ou por 
inspeção dos gráficos 3.24. 

Além de t, e Mp, podem ser definidos o tempo de pico tp e o tempo de 
acomodação ts. O tempo de acomodação (settling time) ts é aquele que corres- 
ponde ao instante em que a saída entra em uma faixa de tolerância (no caso) 


M, = exp(— ) (3.393) 
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Sistema de Segunda Ordem 


Figura 3.23: Resposta típica de um sistema de segunda ordem. Nesse exemplo, 
E = 0.456 e wy, = 2 


de 2% em relação ao valor de regime. 


Observação importante 
Notar que o sobressinal M, depende somente do coeficiente de amortecimento 
é, enquanto o tempo de subida t, depende de £ e de wn. 


Embora ainda não tenha sido definido formalmente, a margem de fase de um 
sistema de segunda ordem é calculada a partir da malha aberta 


2 


L(s) = ——"—_ 3.394 
(s) 4 un ( ) 

e a sua fórmula é 5 
y= tan} d (3.395) 


VV ET — 282 


também depende apenas de é. 


Exemplo: Sistema massa + mola + amortecedor 


Retomando o sistema massa+mola+amortecedor, seja fmola = ky) € amortecedor = 


by, de modo que 
mä = f — bý — ky (3.396) 


em que f é uma força de tração externa. 
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Mp x E 
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! H ! ! 
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i 
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i i i i i 
15p="—"—"— | ud E fria Taa atat aA | i i 
H ! ! ! i { 
0p ia Siemans ai aaa H i i 
H ! ! ! i i 
5 ba + EPEE PE ae aaa ni OOA i i 
l ! | ! i i 
olb-.---.-! | ns os an E ee ra: A j 
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 


Figura 3.24: Gráficos Mp x € e trWn X é. 


Assumindo que o corpo está inicialmente em repouso (y = 0, y = 0) e a força 
f é aplicada a partir de t = 0, a transformada de Laplace permite escrever 


(ms? + bs +k) Y(s) = F(s) (3.397) 


ou 


1 
= m 3.398 
Fa) Sr ksh pao 


Logo os parâmetros € e wpn são 
k 


= 3.399 


Ewn (3.400) 


E 
m 


A figura 3.25 apresenta as respostas de sistemas de segunda ordem com wp = 1 
e com valores de é = 0.0,0.2,0.4,0.6, 0.8, 1.0, evidenciando o efeito do coefici- 
ente de amortecimento. 


Vê-se, também, na figura 3.25, o significado do conceito de frequência natural, 
no caso, wn = 1, que corresponde ao período de oscilação de P = 2 +7/wn = 
6.28 s. 

Enfim, sistemas de segunda ordem podem ser facilmente especificados me- 
diante duas de suas caracteristicas: percentagem de sobressinal + tempo de 
subida, razão de decaimento + tempo de acomodação, margem de fase + lar- 
gura de banda, entre outras combinações, uma vez que são necessários apenas 
dois parâmetros € e wn para determinar a posição dos polos. 
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Efeito do ¢ na Resposta Degrau 
s2E=02 
£=0.4 
£=0.6 


05 


O 2 4 6 & 0 12 14 16 18 20 

Tempo [s] 
Figura 3.25: Respostas de sistemas de segunda ordem com w, = 1 mas com 
variados valores de £. 


3.12.1 Polos dominantes 


Os modelos de segunda ordem são, muitas vezes, úteis para o estudo de siste- 
mas de ordem maior, pois muitas vezes estes podem ser aproximados, valendo- 
se do conceito de polos dominantes. 


Seja um sistema que possui polos pı = —o + jw, p2 = —0 — jw (o > 0,w > 0) 
além de polos p;, i = 3,...,n de modo que Re{p;} < —o, i = 3,...,n. Lem- 
brando que efetr:t decai muito mais rapidamente que e~*, constata-se qu,e 
após um breve transitório, os modos que predominam são e?!" e eP2*, 


Considere a função de transferência 


10º 


G(s) = TE + Ds + De + 100)( + 200) SA) 


em que há 2 polos afastados — 100 e —200. 


A saída Y(s) correspondente a uma entrada degrau R(s) = 1/s é dada por 


Y(s) = G(s)R(s) (3.402) 
= dor (3.403) 
s(s + 1)(s + 2)(s + 100)(s + 200) 
25 —50.759 25.768 —0.010 0.001 


s+1 © s+2 "55100" 54200 


(3.404) 
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A saída y(t) para t > 0 é dada, portanto, por 


y(t) = 25—50.76e7* + 25.77 e7% —0.01 e 1 + 0.001 e72% (3.405) 
1 ———  ——————  ————— poa 
dominante negligenciavel 
~ 25—50.76e€°+25.776 É :t>0 (3.406) 


uma vez que os termos —0.010 e 190, 0.001 e720 são de pequenos coeficientes 
e decaem mais rapidamente quando comparado aos termos dominantes. 
O cancelamento pode ser realizado diretamente na função de transferência, 
levando-se em consideração que, para frequências de interesse (w = 1,2), tem- 
se que jw << 100, ou seja, (jw + 100) = 100 
10° 
G(s) = aj +2) x 100 x 200 aed) 
50 


(s+ 1)(s+4+ 2) 
Deve-se ter cuidado para não cometer o erro de meramente excluir os termos 
com polos afastados ((s + 100) e (s + 200) no exemplo). 


(3.408) 


10° 
as) = (s + 1)(s + 2)(s +460) (s+200 goa) 
6 
= O 4 ERRADO! (3.410) 


(s+1)(s+2) 


Exemplo: Polos dominantes 


Com o intuito de ilustrar a utilização do conceito de polos dominantes, consi- 
dere o diagrama de blocos visto na figura 3.26. 


Controlador Processo 


R(s) E(s) U(s) 1/2 Y(s) 


Figura 3.26: Exemplo de utilização do conceito de polos dominantes em pro- 


jetos de controladores 


O problema consiste em ajustar a posição do parâmetro a, na função de trans- 
ferência 


Y(s) s+a 


1 
= 3.411 
E(s) 2s(s+1)(s4+2) ( ) 
1 s+a 
= -s 3.412 
2 53 + 382 + 2s ( ) 
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de modo que, em malha fechada com ganho negativo unitário, a resposta 
degrau apresente um sobressinal de 16.3%. Se a hipótese de polos dominantes 
for válida, o que deve ser verificado a posteriori, esse sobressinal corresponde 
a fazer € = 0.5. 
A função de transferência de malha fechada é 

Y(s) sta 


= 3.413 
R(s) 28º +682+5s+a 


e a expressão 3.413 deve assumir, mediante ajuste de a, o formato desejado 
Ta(s) com um par de polos complexos dominantes e mais um polo afastado p, 
ou seja, 


s+a 

Tals) = (s — p) (s? + 2£wns + w2) ate) 
= s+a 

— As — p) (s? + 2£wns + w3) (Ale) 

a, (3.416) 


253 + (4€w — 2p) 52 + (2w? — 4péw) s — 2pw? 
Igualando-se os denominadores de 3.413 e 3.416, tem-se que 
253 + 652 + 5s +a = 2s? + (4éw — 2p) 52 + (Qu? = Apéw) s— 2pw? (3.417) 


e, portanto, deve-se ter 


6 = 4w-—2p (3.418) 
5 = 2w? — 4péw (3.419) 
a = —2pw* (3.420) 


Impondo a condição de projeto, € = 0.5, resulta um sistema de 3 equações a 


3 incógnitas 


3 w—p (3.421) 
5 = 2w? — 2pw (3.422) 
a = —2pw? (3.423) 
que leva a w = 5/6, p = —13/6 ea ~ 3. A parte real dos polos dominantes é 


dada por —wn cos(60º) = —5/12 = —0.41667 >> —13/6 = —2.1667, valendo 
a aproximacao por polos dominantes. Sempre que se adota uma metodologia 
de projeto que envolve aproximações, é importante fazer uma verificação do 
resultado obtido. 
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3.12.2 Efeitos do zero 


Quando se projeta um controlador utilizando conceito de polos dominantes, é 
imprescindível verificar o resultado, visto que envolve uma aproximação. 


Em particular, quando há zeros na função de transferência, o cuidado deve ser 
redobrado, como visto na figura 3.27. 


Efeito do “zero” 


undershoot 


0 2 4 


ts] 


Figura 3.27: Exemplo de utilização do conceito de polos dominantes em pro- 
jetos de controladores. 


As funções de transferência utilizadas na figura 3.27 são 


1 -s+a 
PA = eer a 
1 s+B 


em que a = 0.25; 0.35;0.45 e 8 = 1.0; 2.0. 


Na prática, sistemas de primeira e segunda ordem aproximam adequada- 
mente um grande número de processos de interesse. Além disso, o compor- 
tamento desses sistemas é facilmente caracterizado por um pequeno número 
de parâmetros intuitivos. Em particular, sistemas de segunda ordem podem 
ser especificados por £ e wn, coeficiente de amortecimento e frequência na- 
tural, respectivamente. 
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3.13 Resposta em frequência 


O sinal senoidal tem propriedades especiais com referência a sistemas LTI tanto 
pela facilidade que proporciona na análise teórica, quanto em procedimentos 
experimentais. 

Dado um sistema linear representado pela função de transferência G(s) com 
todos os seus polos com parte real negativa, se a entrada é senoidal 


u(t) = U sin(wt) (3.426) 


então a resposta y(t) em regime permanente do sistema é também senoidal de 
mesma frequência e dada por 


y(t) = |G (jw)| U sin (wt + ZG (jw)) (3.427) 
N(s) 


Considere um sistema representado por G(s) = Dts) © seja uma entrada se- 
noidal u(t) = U sin (wt) cuja transformada de Laplace é 


Uw 


A saída do sistema para esta entrada é então 


N(s) Uw 
D(s) (s? + w?) 
= N(s)Uw 

= Gap) EE ED) eee) 


Y(s) = G(s)U(s) = (3.429) 


cuja expansão em frações parciais, assumindo que o conjunto de polos é cons- 
tituído de polos reais distintos, polos reais com multiplicidade maior que 1 e 
polos complexos conjugados, resulta em 


A An B B 
Y(s) = — eh + Hop + 
(s + pı) (s+pPn) (s+pk) (s+pp) 
Cis+D E E* 
E ENO na | (3.431) 


(sho +w? (s— jw) © (s+ jw) 


em que os coeficientes A;, Bk e C e D correspondem aos polos do sistema e 
os coeficientes E e E* aos polos do sinal de entrada e são dados por 


pie 5 Olde) (3.432) 
EY = Glia) (3.433) 
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Invertendo a transformada de Laplace, obtém-se 


y(t) = Aye ht" ++ Ane Pr + 
+ Bye P* + Byte PRÉ po + 
+Kie “cos (wit + 1) + ++» + Beit + E*e It (3.434) 


Como por hipótese todos os polos do sistema têm parte real negativa, a saída 
em regime permanente (t — 00) será 


Yrplt) — 04 +0 be ee (3.435) 


Portanto, substituindo os valores de E e E* das equações 3.432 e 3.433, 


sro(t) = 5-6 (o) Et + SG (cj) em (3.436) 


2j 
que, após simplificação, resulta em 
Yrp(t) = |G (jw)| U sin (wt + ZG (jw)) (3.437) 


Conclui-se que para modelos LTI estáveis, o cálculo da resposta a uma 

entrada senoidal, em regime permanente, requer apenas o ganho de amplitude 
|G (jw)| e a defasagem ZG (jw). 
Como os sinais periódicos podem ser decompostos em uma soma de senoides 
(harmônicas nas séries de Fourier) e os sistemas lineares satisfazem o princípio 
da superposição, os valores numéricos de |G (jw)| e ZG (jw) para frequências 
variando de 0 a œo constituem uma representação da dinâmica do sistema. 


3.13.1 Curvas de Bode 


Em geral, quando a representação gráfica G (jw) e apresentada na forma de 
módulo e fase, são utilizados dois sistemas de coordenadas: 


Curva de Magnitude: 20 log(|G(jw)|) x logw 
Curva de Fase: ZG (jw) x logw 


Tais gráficos são chamados de curvas de Bode e a de magnitude é representada 
em dB e, usualmente, a de fase em graus. 


As curvas são traçadas em papel monolog e a leitura do eixo das abscissas é 
realizada em rad/s. 


Considere a função de transferência 


K (s — z1) ... (5 — 2m) 


ais = af =oa) 


(3.438) 
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e note que 

K |jw — a]... [jw — 2m| 
iw — pal... |Jw — pn] 

Para fazer esboços gráficos, é mais conveniente que se tenha somas de termos 

ao invés de multiplicações. Assim, aplicando-se 20 log(.) em ambos os lados 

da expressão 3.439 tem-se que 


|G(jw)| = (3.439) 


20 log |G(jw)| = 20log K + 20log |jw — z1| +... + 20 log |jw — zm| 
—20 log |jw — pı| +... + 20 log |jw — pn | (3.440) 


O gráfico de 20 log K é simplesmente uma constante. 


O gráfico dos ganhos, compostos pela soma de curvas associadas a termos do 
tipo 20 log |jw — al, cada quais aproximáveis pelas assíntotas 


e Sew << a, então 20 log |jw — a| = 201og |a| que é uma constante. 


e Sew >> a, então 20log |jw — a| = 20log w que é uma reta usando escala 
[dB] na ordenada e log w. 


Para a fase, tem-se que 


£G(jw) 


F (Ee) (3.441) 


(jw — pi)... (Jw — pn) 
£ (jw — z1) + -+ 4 (jw — zm) 
£ (jw — pı) — ... — < (jw — pn) (3.442) 


em que cada termo do tipo £ (jw — a) possui a aproximação vista na figura 
3.28 traçada para a = 10. A aproximação da curva de fase pode utilizar os 
pontos notáveis 0.2a e 5a. 


3.13.2 Resposta em frequência de um sistema de segunda ordem 


Como mencionado anteriormente, os sistemas de segunda ordem desempenham 
um papel muito importante na prática e, consequentemente, são relevantes os 
conhecimentos quanto à sua caracterização no domínio da frequência. 


Os pontos notáveis nas curvas de Bode de sistemas de segunda ordem são a 


frequência de ressonância 
wr = wny/ 1 — 262 (3.443) 


e o pico na resposta em frequência (usualmente apresenta-se em dB) 


1 


ETE 


(3.444) 
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Curvas de Bode: Sistema de 1º ordem 


t pe 


| GG) | [48] 


1 década } 


G(u) [°] 


log(w) [rad/s] 


Figura 3.28: Parcela das curvas de Bode correspondentes a um termo 1/(s+a). 


A figura 3.29 apresenta uma resposta em frequência típica de um sistema de 
2º ordem subamortecida, além de indicar o significado do pico em ressonância 
M, e a frequência de ressonância wp. 
Se o sobressinal desejado é M,, tem-se a partir da equação 3.393 que o coefi- 
ciente de amortecimento requerido é 


In M, 


a= 
\/72 + In? M, 


que corresponde ao pico na resposta em frequência M, fornecido pela expres- 
são 3.444. Estando de posse do valor de € e uma outra especificação, como o do 
tempo de subida, pode-se determinar wn e, portanto, wr, segundo a expressão 


3.443. 


(3.445) 


3.13.3 Resposta em frequência de um atraso de transporte 
Conforme visto em 3.97, o modelo do atraso de transporte é da forma 
y(t) = u(t — T) (3.446) 
e, portanto, a função de transferência correspondente é 
Y (s) = L(u(t— T)) = Ulsje Fº (3.447) 


Para efeito da resposta em frequência e traçado das curvas de Bode, nota- 
se que [eivT| = 1, constante, ou 0dB = 20log(1). Porém, a fase é dada 
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Curvas de Bode: Sistema de 2º ordem 
E O F F r E 


-40 dB/dec | 


Gu) | [dB] 


G(ko) |] 


t i + a a + + + a SUR VS q 4 
101 O =1 10! 
log) [rad/s] 


Figura 3.29: Curvas de Bode de um processo de 2° ordem em que se indica o 
significado do pico em ressonância M, e a frequência de ressonância wp. 


por <e-J*? = —wT e, portanto, cresce indefinidamente com o aumento da 
frequência w. 


Uma visualização gráfica e intuitiva é apresentada na figura 3.30, em que se 
observa que um mesmo atraso de transporte de T = 0.7855 corresponde a 
diferentes valores de atraso de fase. No caso, atrasos de fase de 7/4rad para o 
sinal sin(t + T) em relação ao sinal sin(t) e de 7/2 rad para o sinal sin(2t + T) 
em relação ao sin(2T). 


sin(t) À 
t 
> 
sin(t-T) À 
A e 
sin(2t) À Atraso de 7/4 
LNLS Ss > 
sin(2t-T) À i 
> 
a Atraso de 1/2 


Figura 3.30: Influéncia da frequéncia no valor do atraso de fase 
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As curvas de Bode representam, graficamente e de modo com- 
pleto, o comportamento de um sistema. Logo, as curvas de Bode 
desempenham um papel muito importante em projeto de controla- 
dores, uma vez que várias características importantes do sistema, 
como a ressonância, a margem de fase e a banda passante, podem 
ser facilmente visualizadas e modificadas. 


3.13.4 Filtro complementar 


Quando se tem dois sensores medindo uma mesma grandeza e a faixa de 
frequência dos ruídos é diferente, existe um exemplo muito ilustrativo da im- 
portância do conceito de resposta em frequência. Na figura 3.31 são apresen- 


Ruído de Filtro Ruído de 
Alta-Frequência Passa-Baixa Alta-Frequência 
jf 


Vy=ytny ae 
1-697 à SE A 
y y 
= 
baa + v2=y+n; — + 
ple pS Pos a 


No 


Ruído de Filtro Ruído de Filtro 
Baixa-Frequência  Passa-Alta Baixa-Frequência Passa-Alta 


Figura 3.31: Filtro complementar 


tadas duas alternativas para implementação do filtro complementar. 


O sinal vı é uma medida da grandeza y perturbado com um ruído aditivo de 
alta frequência, enquanto vg é a medida de y perturbada com um ruído de 
baixa frequência. 


Um exemplo é a estimação da velocidade baseada em dois sensores diferen- 
tes: um acelerômetro e um sensor de posição. Os sinais vı e vg poderiam 
corresponder à integral das medidas do acelerômetro e derivadas do sensor de 
posição. Nesse caso, a integração possui efeito de filtro passa baixas enquanto 
o derivador exacerba os ruídos. 


3.13.5 Cartas de Nichols 


A carta de Nichols, às vezes chamada de carta de Nichols-Black, é uma ferra- 
menta gráfica (ábaco) que permite a visualização simultânea de características 
de malhas aberta e fechada de controle. 


Seja Gma(s) uma função de transferência de malha aberta. Dados os valores 
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numéricos do módulo |Gma(jw)| e da fase “Gma(jw) para uma dada frequên- 
cia w, a Carta de Nichols permite ler graficamente o módulo |[Gmr(jw)| e a 
fase de “Gmr(jw) de malha fechada 


GMA 
G =o 3.448 
UPRTE T ( ) 


em um gráfico módulo x fase. E usual utilizar a escala dB no eixo da ordenada, 


Exemplo: Carta de Nichols 


A figura 3.32 ilustra o aspecto de uma Carta de Nichols para a função de 


transferência 
s+3 


=e T (3.449) 


GMA 


Carta de Nichols-Black 
“| cio | i 
1+G(jo) 4 


© 

> E É Ee i 
> +G(je 

S (jo) 


40 


20 


-360 -315 -270 -225 -180 -135 -90 45 0 
£G6(w) [] 


Figura 3.32: Carta de Nichols para a função de transferência de malha aberta 
1/s(s +1)(s + 2). 


E interessante ressaltar que curvas de Bode podem ser obtidas experimen- 
talmente no laboratório, utilizando-se um gerador de sinais senoidais e um 
osciloscópio, ou de um sistema digital de geração e aquisição digital de sinais. 


3.13.6 Largura de banda 


Intuitivamente, sistemas que possuem respostas rápidas são aqueles que ate- 
nuam pouco os componentes de frequências mais elevadas. O grau de atenu- 


Modelos dinâmicos 113 


ação das altas frequências em relação às baixas pode ser expresso quantitati- 
vamente pela largura de banda. 


Dada uma função de transferência G (s), a largura de banda é a faixa (0, we), 
sendo que a frequência de corte we é caracterizada por 


IG (jw)| < |G (jwe)| -3dB Vw > we. (3.450) 


O conceito de largura de banda é importante uma vez que, quanto maior, 
a resposta do sistema tende a ser mais rápida. Intuitivamente, tal fato esta 
relacionado com a proporcionalidade inversa entre w e t. 


3.14 Realizações simples 


Dadas as matrizes {A,B,C,D} de uma representação no espaço de estados, 
a função de transferência é obtida facilmente aplicando-se a fórmula 


G(s) = C(sI— A) !B+D (3.451) 


como foi visto em 3.315. 


Por uma questão de simplicidade, vamos assumir que D = [0] e que G(s) é 
escalar. 


O problema de realização consistem em obter {A,B,C} a partir de um G(s) 
dado. 


Forma canônica controlável 


Considere uma função de transferência G(s) dada por 


Y(s) 
U(s) 


= G(s) (3.452) 


= — (3.453) 
s” +aqjs™it+...+Qn_15 + An 


e, note que, para condições iniciais nulas e utilizando a notação (9 = dy /dtº, 
tem-se 
y™ + ayy) + +any+aoy= cou (3.454) 


ou 


(OD) = Oy 4 — agy + cou (3.455) 
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Fazendo-se a associação 


—2 
Tn-1 = y” ) 
Zn uv) 
segue imediatamente que 
tı = Y= 
ta = Ü= T3 
. -1 
ini = yD = grn 
La = y”) = —G12n — ... — An—1L2 — GnZ1 + cou 


Substituindo a expressão 3.455 em 3.463 e utilizando a notação 


T 
xe | i L2 +++ Ln- Ln 
tem-se 
0 1 0 0 0 
0 0 1 0 0 
x= : x + u 
0 0 0 1 
an an-1 Qn—-2 ‘7° —M 1 
ee “Sa 
A B 
e 
p= |a 0 0 0 0lx 
—1—— SY 
C 
ou seja, 


x = Ax+4 Bu 
= Cx 


Quando a matriz C possui a forma especial 


C=| co Cm-1 Cm O ©:: 0 | 


(3.456) 
(3.457) 


(3.458) 
(3.459) 


(3.460) 
(3.461) 


(3.462) 
(3.463) 


(3.464) 


(3.465) 


(3.466) 


(3.467) 
(3.468) 


(3.469) 
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tem-se da expressão para G(s) 


* Ox * 1 0 
* Ox * Ss 0 
1 ; 
G(s) = | co GQ Choo Cn-1 : 
A(s) 
* ok cc k n—2 0 
* OK oe. Ok sro 1 


com cy = 0 param +1 < k < n — 1 que resulta em 


CmS™ Atas +... + 1S + Co 


G(s) = 3.470 
(s) s? + an—18”71 +... + a1s + ao ( 
A realização obtida é controlável, pois 
U = [B;AB; AtB] (3.471) 
00 --- 0 1 
0 0 --- 1 0 
= me oes oe DS (3.472) 
0 1 * Ox 
1 x * * 
que tem posto n. 
3.14.1 Forma canônica observável 
Para sistemas de 1 entrada e 1 saída, G(s) é 1 x 1, tem-se que 
G(s) = GT(s) (3.473) 
C(sI-AJIB = B*(sI— A!) ic” (3.474) 


e chamando Ĉ = BT e B = CT de modo que G(s) = C(sI — A7)~!B, tem-se 
que 


C BT 
CAT BTAT 
V = . = . (3.475) 
n—1 n—-1 
E (AT) BT (aT) 
e, portanto, 
v? = [B;AB;...; A”-1B] (3.476) 
U (3.477) 


Como a transposição não altera o posto, V possui posto n e, portanto, a 
representação é observável. 
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3.14.2 Realização diagonal 


A função de transferência pode ser expandida em frações parciais 


m m-1 
6a) = que Ea de +... +cis+co (3.478) 
S” +an-18 +... + as + ag 
ri Tn 


+... + 
5 — pi S — Pn 


(3.479) 


Assumindo que p; # pj, para i # j, para evitar a necessidade de recorrer à 
forma completa da representação de Jordan, tem-se que 


Y (s) rı Tn 
= +... + 3.480 
U(s) s-pı 5— Pn Ce 
ou seja, 
Y(s) = VYi(s)+...+ Yn(s) (3.481) 
m Tn 
= U ae U 3.482 
U8) ++ (US) (3.482) 
A realizacao de 
Ti . 
G; = a= ss: 3.483 
(= i= dun (3.483) 
é imediata, 
ti = —pri + riu ; i= 1,...n (3.484) 
T 
Assim, para x = | £1 £2 +++ Zn—1 Tn | pode-se escrever 
—p, 0 0 0 rı 
0 —po 0 0 r2 
š = E E 0 |x+ ju (3.485) 
0 0 0 -pn-1 0 Tn—1 
0 0 0 ree —Pn Tn 
A B 
e, para a saída, de 3.481, 
y=[1 101 1])x (3.486) 
a ae” 
C 


Quando o estado x está disponível, pode-se conceber uma estratégia de con- 
trole baseado em modos, utilizando mudança de base. 
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Note que se P € R”*” é não singular, então a transformação 


x = Px (3.487) 
permite escrever 
x = Px (3.488) 
= P(Ax+ Bu) (3.489) 
= PAP !'x+PBu (3.490) 
PESO O toe 
A B 


Esse tipo de transformação é dita ser similar e os autovalores são preservados, 
ou seja, 


det(AI— A) = det(APPT! — PAP”) (3.491) 
= det(P(AI— A)P) (3.492) 
= det(P) det(AI — A) TP) (3.493) 
= det(AI — A) (3.494) 
3.14.3 Utilização dos parâmetros de Markov 
Considere inicialmente a função de transferência 
n n—1 eee 


s” tas" 1+---+an 


Através de divisão longa, G(s) pode ser escrita em termos de polinômio em s’, 


Bos” + Bis” I++ bn 


—1 

= Bo+(8i—abo)s +: (3.496 

sr + ags”! Eitean fo (61 a 180) ( ) 
= hoths!+hos? +--+ (3.497) 


em que h; são introduzidos para simplificar a notação. 
Inspecionando-se os coeficientes de s*, obtém-se que 


fo: = Bo (3.498) 
hy = —aiho + By (3.499) 
ho = ah, — agho + Bo (3.500) 


hk = —ayhp_1 — ashpo—---— axho + bk (3.501) 
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Portanto, a função de transferência pode ser escrita como uma soma de po- 


tências de s com os coeficientes dados pelos parâmetros de Markov: 


G(s) =ho+his 1 +hos 24... 


A matriz de Hankel, denotado H(m, n), é definida por 


hy ho An 

hg hg hn+1 
H(m,n)= | h3 h hn+2 

hm hm+1 Er hmin- 


Por outro lado, considere a representação no espaço de estados 
x = Ax+ Bu y = Cx 
cuja representação no domínio transformado é 
G(s) = C(sI — A) !B 
Sabendo-se que 
(sI — Ay =I + As! + AAs se Ao 
a função de transferência pode ser reescrita como 


G(s) = C(I+As 1+ A’s?+---)B 
CB + CABs-! + CA?Bs~?+--- 


(3.502) 


(3.503) 


(3.504) 


(3.505) 


(3.506) 
(3.507) 


Comparando-se os termos desse polinômio em s com o que envolvia os 


parâmetros de Markov h;, obtido anteriormente, constata-se que 


hy = CAIB 


Os passos para utilizar o conceito de parâmetros de Markov para realizar G(s) 


são: 


e A partir do G(s) de ordem n, efetuar a divisão longa e obter os parâme- 


tros de Markov {hj,..., han} 
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e Construir a matriz de Hankel 


hy ha hn 
ha ha hn+1 
H(n t; n) = : : . : 
hn hni Bee Plays 
hn+1 hn+2 hon 
e Determinar o posto de H(n + 1,n) 
nº = p{H(n+1,n)} 
e Obter | Oy AQ ce Qn* iat ue sen tal que 
[ar a2 +++ aw 10 0]H(n+1,n)=0 
e Construir as matrizes A,B e C 
a hs 
ie o 1 Poe elas 
An 
—a, —a2 Ans 
E = | 10.. 0 | 
Pode-se verificar que 
U =[BAB- AIB | =H(n*,n*) 
C 
CA 
V = = 
CAT! 


possuem rank n*. 


(3.508) 


(3.509) 


(3.510) 


(3.511) 


(3.512) 


(3.513) 


(3.514) 


Portanto, a representação é completamente controlável e observável, ou seja, 


a realização é mínima. 
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Teorema de Silverman 


Uma sequência infinita de parâmetros de Markov é realizável por um modelo 
LTI, se e somente se existirem inteiros n e m tal que p(H(n,m)) = p(H(n + 
1,m+i)) = n* para i = 1,2,.... Nesse caso, n* é a ordem da realização 
mínima. 


3.14.4 Realização de Gilbert 


Seja G(s)pxm uma função de transferência estritamente própria (D = 0,xm) 


G(s) = gls) 33 = asda ge Long (3.515) 


A (s) = s” +asTi+...+as+ao (3.516) 


o mínimo múltiplo comum dos denominadores de g;;(s). 


Assumindo-se que as raízes A;,7 = 1...,7 do polinômio característico são dis- 
tintas, pode-se escrever 


A(s) = II (s — dj) (3.517) 


G(s) =>, R; (3.518) 
i=l S — A; 
Os resíduos são obtidos fazendo-se 
R; = lim (s — A;) G(s) (3.519) 
so; 
Denote-se 
pi := rank (Ri) (3.520) 


e sejam matrizes C; e B; escolhidos de modo que 
R; = C;B; (3.521) 
Nessas condições, uma realização controlável {A,B,C,0} é dada por 


Api x pr Bi 
A= Ea BS) | 405 Ch we Ce 
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Exemplo 


Considere a função de transferência 


Rua 2 
G(s) = | sti oh | 
( 


s+1)(s+2) s+2 


e seja A (s) = (s + 1) (s + 2). 
A expansão em frações parciais leva a identidade 


1 s+2 2s+4 
G = 
(s) (s+1)(s+2) 1 s+1 
1 1 
= Rı T Ro 
s+1 s+2 
em que 
1 2 0 0 
Portanto, 
pr = 2 
p2 = 


e uma possibilidade de escolha de C; e B; seria 
1 2 10 1 2 
m=| 4, Ta AE d 
Cc B 


me [2 9] =[3]l 


B2 


(3.523) 


(3.524) 


(3.525) 


(3.526) 


(3.527) 
(3.528) 


(3.529) 


(3.530) 


(3.531) 


(3.532) 
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100 
«=| 1 | (3.533) 


5 S zij ; E . 
Para verificação, basta calcular C (sI — A) ` B. Além disso, pode-se verificar 
que a representação é completamente controlável e observável, ou seja, é mi- 
nima. 


Para sistemas de 1 entrada e 1 saída, G(s) é 1 x 1, tem-se que 
G(s) = GT(s) (3.534) 
C(sI-AJIB = B/(sI- A!) ic” (3.535) 


e, chamando Ĉ = BT e B = CT de modo que G(s) = C(sI — AT)-!B, tem-se 
que 


C BT 

CA” BTAT 

V= . = : (3.536) 
ae n—1 n—-1 
C(AT) BT (AT) 
e, portanto, como esperado, 

vT? = [B;AB:..; A”!B] (3.537) 
= U. (3.538) 


Como a transposição não altera o posto, V possui posto n e, portanto, a re- 
presentação é observável. 
Mais detalhes no artigo original: 


Gilbert, E. G. Controllability and Observability in Multivariable Control Sys- 
tems. S.I.A.M. Control, Ser. A, 1, p. 128-151, 1963. 


É importante a habilidade de transitar entre as diferentes representações 
no espaço de estados e através das funções de transferência, visto que es- 
pecificações diferentes se adaptam melhor a uma ferramenta em um certo 
domínio do que em outro. Além disso, funções de transferência podem ser 
obtidas em ensaios laboratoriais, injetando-se sinais senoidais u e observando 
a relação entre y e u (ganho e defasagem). 


Em 1756, Euler Leonhard Euler (1707-1783), um dos maiores matemáticos da 
história, escreveu Elementa Calculi Variationum, em que apresenta a equa- 
ção de Euler-Lagrange. No entanto, a primeira solução para um problema de 
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cálculo de variações é atribuído a Sir Isaac Newton PRS (1642-1727) por ter 
resolvido o problema de obter o perfil de uma figura geométrica de revolução 
que oferecesse a mínima resistência ao movimento em um fluido, em 1687. 


Em 12 de agosto de 1755, Joseph-Louis Lagrange (Giuseppe Luigi Lagrangia, 
1736-1813) escreveu uma carta a Euler, apresentando um novo método para 
resolver os problemas na obra Methodus inveniendi lineas curvas maximi mi- 
nimive proprietate gaudentes sive solutio problematis isoperimetrici latissimo 
sensu accepti de Euler, escrito em 1744 e editado por Marcum-Michaelem 
Bousquet. 


Euler Lagrange Bromwich Heaviside 


Em 1898, Oliver Heaviside FRS (1850-1925) apresenta o cálculo operacional 
e estuda o comportamento transitório de sistemas, introduzindo o conceito 
análogo ao de função de transferência. 


O cálculo operacional de Heaviside foi colocado em alicerces robustos por Tho- 
mas John I’Anson Bromwich (1875-1929) e, em particular, a integral de con- 
torno utilizada na transformada inversa é chamada de integral de Bromwich. 


3.15 Exercícios 


3.15.1 Exercício: Sistema eletromecânico 


Os sistemas micromecânicos (MEMS) são, em geral, baseados em efeitos elé- 
tricos ao invés de dispositivos maiores que se valem de efeitos magnéticos. 


Se o dielétrico é o ar, a rigidez dielétrica é da ordem de 3E6V/m resultando 
E° = 3e0E2 ~ 40 Jm”?. 

Por outro lado, utilizando indutores com núcleo de ferro, considerando satu- 
ração a 1.6 Wb.m”2, tem-se Em = zgb 850 Jm. 

Assim, dispositivos baseados em efeitos elétricos são interessantes para dispo- 
sitivos de pequenas dimensões, como os manufacturados com tecnologia mi- 
croeletrônica. Neste exercício, busca-se obter um matemático na forma de um 
sistema de equações diferenciais ordinárias para o sistema ilustrado em 3.33 
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Figura 3.33: Um sistema físico envolvendo elementos elétricos e mecânicos. 


sabendo-se que as expressões para T, V e R elétricos, respectivamente, Tele, 
Vele € Rele, SãO 


as . Tere 
Tele = atá ; Vele = (9? ; Rete = 5 Ra) (3.539) 


2C(x) 


3.15.2 Exercício: Modelos de pêndulos 


Utilizando a formulação Lagrangiana, obter modelos para as duas modalidades 
de pêndulos da figura 3.34. 


> 


< 


k 


>” 

~ 

S 
: L $ | i [ i 

| : | — 5 j g | ake 
! MC ) | 8 « /4 l O M 
! M 
M( ) 


(a) (b) (c) (d) 


Figura 3.34: (a) Modelo simplificado de uma ponte rolante; (b) modelo sim- 
plificado para um objeto suspenso por uma fixação elástica. 


3.15.3 Exercícios: Solução de equações diferenciais ordinárias 
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Obter as soluções das seguintes equações diferenciais ordinárias lineares e in- 


variantes no tempo. 


Observação: E interessante resolver as equações no domínio do tempo (t) e no 
domínio transformado (s) e verificar que os resultados são compatíveis. 


1. 


OY. a 
2p t uty = 0 
y(0) = 
y(0) = 0 
y + 3y ô (t) 
y(0) = 0 
y+3y = u(t) 
y(0) = 0 
y+3y = sin(10t) 
y(0) = 0 
tp in (1) 
yt3y = sin 
y(0) = 0 
y+3y = e 


y (0) 


(3.540) 


(3.541) 
(3.542) 


(3.543) 
(3.544) 


(3.545) 
(3.546) 


(3.547) 
(3.548) 


(3.549) 
(3.550) 


(3.551) 
(3.552) 
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ta, % $+ ¢ 

H,+ hy Hyth 
Ry Ro 
Ne a 
mx X 
pa ENE | 
Qi + q 3+ +0$ 


Figura 3.35: Sistema de 2 tanques acoplados. 


3.15.4 Exercício: Sistema de tanques acoplados 


Obter um modelo na forma de equação de estados para o sistema de vasos 
comunicantes da figura 3.35. 


As entradas são as variações incrementais das bombas (qı e q2) e as saídas são 
as variações incrementais do nível de líquido (hı e hg). 


3.15.5 Exercício: Modelo de um circuito envolvendo transformador 


Considere o circuito da figura 3.36. Calcular V2/I, sabendo-se que, para o 


Figura 3.36: Um circuito elétrico com transformador. 


transformador, tem-se 


sLiiii + sMig (3.553) 
sMiy + sLooio (3.554) 


vi 


U2 


e os pontos indicam a sua polaridade. 
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3.15.6 Exercício: Modelo de um girômetro 


Considere um giroscópio montado em um sistema de eixos como ilustrado na 
figura 3.37. 


momento angular L 


atrito viscoso b 


molak extremidade fixa 


Figura 3.37: Um sistema girômetro. 


Obter a equação de estado, considerando x, = 0 e 0 e, caso resulte em um 


modelo não linear, linearize-o. 


3.15.7 Exercício: Erros em regime permanente 


Calcular os erros em regime para entradas degrau e rampa, supondo que as 
funções de transferência fornecidas são de malha aberta e a realimentação a 


ser utilizada é unitária. 


1. 
G (s) = aa (3.555) 
f Ef) ee 3.556 
(s) = s(s+1) (3. ) 

3. nie 
G(s) = Fer (3.557) 

4. sad 
G(s) = ere, (3.558) 


3.15.8 Exercício: Ampliadores operacionais (OpAmps) 
Obter a função de transferência Y (s) /U (s) para cada circuito da figura 3.38. 


128 Engenharia de controle 


R 1 
ý C 
u 

aoo 
O 

Ro 

Cp 
C; 
R R3 
5 1 a y 


Figura 3.38: Circuitos de relevancia pratica utilizando OpAmps. 


3.15.9 Exercício: Traçado de curvas de Bode 


Esboçar as curvas de Bode: 


1. 
oO) Ga ENTE +10) 
2, 
Sap 
3. ' 
a (s+1) 
4 : 
Oe) R=i) 
5. swe is 


(s? +s +1) (s +10) 


(3.559) 


(3.560) 


(3.561) 


(3.562) 


(3.563) 


10. 


11. 


12. 


13. 


14. 


15. 
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10 
GD GD) 
= 10(s+1) 
Ce) (s+ 2)(s+5) 
G(s) = 1 
a(s) = Et 5 
o (1 —s) 
Cs (s+1) 
9 (s? +0.25 +1) 
Ce s(s?+1.2s +9) 
o s(s—1) 
(= (427645) 
coa 


| 
8 
a 


100e o>" 
Ge) s(s+1) 


(3.564) 


(3.565) 


(3.566) 


(3.567) 


(3.568) 


(3.569) 


(3.570) 


(3.571) 


(3.572) 
(3.573) 


(3.574) 


(3.575) 


(3.576) 
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3.15.10 Exercício: Traçado manual de curvas de Bode 


Esboce manualmente, utilizando lápis e papel monolog, as curvas de Bode 


; 9 (s +0.25 + 1) — 
Eis s(s2+1.25+9) fio, 


3.15.11 Exercício: Resposta em frequência de um filtro 


Esboçar as curvas de Bode (Vout (s) é a saída e Vin (s) a entrada) do circuito 
da figura 3.39. 


Figura 3.39: Um circuito utilizando amplificador operacional ideal. 


3.15.12 Exercício: Margens de ganho e de fase 
Determinar MF e MG: 


(a) ; 
G(s) = 3.578 
(=a (3.578) 
(b) (84.5) 
s+ 
(c) i 
G (s) = zE (3.580) 
3.15.13 Exercício: Especificações no domínio da frequência 
Um servomecanismo possui função de transferência 
A 
ais o (3.581) 


s(s +10) (s +20) 
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em que A é o ganho ajustável do amplificador. Qual deve ser o valor de A de 
modo que, ao se fechar a malha com uma realimentação unitária, o sistema 
possua um pico de ressonância M, de 8dB? Em que frequência ocorre a 
ressonância? 


3.15.14 Exercício: Solução de EDO utilizando a transformada de La- 
place 


Obter a transformada inversa de Laplace, utilizando o método da expansão 
em frações parciais 


a) 
s?+28+3 


Ras (+) 


(3.582) 


90 (s + 2) 
s*(s+1)(s+3) 


G(s) = (3.583) 


3.15.15 Exercício: Transformação de representação no espaço de es- 
tado para função de transferência 


Determine a função de transferência Y (s) /U (s) e discuta o resultado: 


0 10 1 

x = 0.2 fOr “oscar lia (3.584) 
ee ae 1 

p= [5 6-1] x (3.585) 


3.15.16 Exercício: Função de matriz 


Considere uma matriz da forma 
a 1 0 
A=10 a 0 (3.586) 
00a 


em que a E€ Rea¥0. Obter uma matriz B, tal que eP = A. 


Lembrar que 
= = (—1)"t! qm 
ln(x) = > SÊ (x — 1) (3.587) 


1= 


H 
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3.15.17 Exercício: Resposta degrau a partir do repouso 


Esboçar a resposta a uma entrada tipo degrau unitário u(t) para o sistema 
descrito por: 


T les Bale: NE (3.588) 
x(0) = [0 o) (3.589) 
y = E 0 |x (3.590) 


3.15.18 Exercício: Resposta à condição inicial 


Esboçar a resposta y(t) para entrada nula u(t) = 0, Vt > 0, sabendo-se que: 


Re | 3 a (uea | (3.591) 
OE i (3.592) 
y = PaO |x (3.593) 


3.15.19 Exercício: Resposta impulso 


Esboçar a resposta impulso do sistema descrito pelas equações de estado 


E (3.594) 
x(0) = [0 o | (3.595) 
y = E 0 |x (3.596) 


3.15.20 Exercício: Resposta degrau com condição inicial não nula 


Esboçar a resposta y(t) para entrada degrau unitário u(t), sabendo-se que 


k= |s eF NE (3.597) 
(0) = [4 i (3.598) 
y = E 0 |x (3.599) 
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3.15.21 Exercício: Propriedade da matriz companheira 


Dada uma matriz quadrada Ann do tipo 


0 1 0 0 
0 0 1 0 
A= ; 
0 0 0 1 
—ün — Queila vs —a 


(a) mostrar que o seu polinômio característico é 


det (sI — A) = s” + ais! +... + an-1S + an 


(b) e os autovalores são da forma 


3.15.22 Exercício: Matriz de Vandermonde 


(a) Mostrar que o determinante de uma matriz de Vandermonde V 


1 fra 1 

Ma ais RA 

Vine A? sae. A2 
Ap piso o ae 


é dado por 


det(V)= JJ (N-A,) 


l<i<j<n 


(3.600) 


(3.601) 


(3.602) 


(3.603) 


(3.604) 


(b) Apresentar uma aplicação desse resultado em problemas de sistemas de 


controle. 


3.15.23 Exercício: Propriedade de autovalores 


Mostrar que se A;, 7 = 1,...,n são os autovalores de uma matriz Ay xn, então 


n 


det (A) = Į [> 


i=1 


(3.605) 
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3.15.24 Exercício: Realizações 
Obter uma representação do tipo 
x = Ax+Bu (3.606) 
y = Cx (3.607) 
para o sistema cuja função de transferência é 


on MSY Cu 
ca U (s) s2+5s+6 (4:008) 


e verificar a controlabilidade e a observabilidade. 


3.15.25 Exercício: Cancelamentos em funções de transferência 


Determine a função de transferência Y (s) /U (s) e discuta o resultado obtido: 


0 1 0 1 

x = 0 0 2/|x+| -—1I lu (3.609) 
—15 —23 -9 1 

y= [ 5 6 iJa (3.610) 


3.15.26 Exercício: Controlabilidade e observabilidade 


Considere um processo representado no espaço de estados por 

0 1 

O |x+| 0 |u (3.611) 
2 0 

0 


v= | 


1. Verificar se o sistema é controlável. Caso não seja, determinar o modo 
não controlável. 


|x (3.612) 


2. Verificar se o sistema é observável. Caso não seja, determinar o modo 
não observável. 


3.15.27 Exercício: Seleção de sensores 


Considere o processo representado no espaço de estado por 
0 


sc. One 
$= Es 1 


y = Cx (3.614) 


x + u (3.613) 
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Assumindo que no mercado existem 4 sensores compatíveis com esse pro- 
cesso, 


G = [2 -2| (3.615) 
G = [a 2 | (3.616) 
E eee Het 1 | (3.617) 
c = Jo 1] (3.618) 


qual o dispêndio mínimo para se conseguir monitorar todos os componentes de 
x, sabendo-se que os custos dos sensores C1, C2, C2 e C4 são, respectivamente, 
R$ 100,00, R$ 150,00, R$ 120,00 e R$ 240,00? 


3.15.28 Exercício: Isolação de falhas 


Um método simples para isolar falhas de sensores é utilizar observadores de 
estado. Considere um sistema que possui 3 sensores associados a matrizes C4, 
Co e Cs. 


x = Ax+Bu (3.619) 
y = Ox (3.620) 
y2 = Cox (3.621) 
y3 = Cx (3.622) 


Assume-se que o estado é observável a partir de quaisquer dos sensores Cy, 
Cz e C3. Denotando por % o estado estimado e %;, i = 1,2,3, as saídas de 
cada estimador, ou seja, 


x = AR + Bu+ L (y3 — 93) (3.623) 
y = CR (3.624) 
jo = QR (3.625) 
jj = Cok (3.626) 


qual o comportamento dos sinais e; = yi — Yi, i = 1, 2,3, se houver falha, uma 
de cada vez, nos sensores 1, 2 e 3? 


3.15.29 Exercício: Inserção de integrador na malha 


Considere o processo representado no espaço de estado por 
01 
0 0 


RAE (3.628) 


x 


: | y (3.627) 


= 
I 
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Deseja-se utilizar uma lei de controle da forma 


u(t) = —Kx(t) + of [r(T) — y(T)| dr (3.629) 


em que r(t) é o sinal de referência a ser rastreada. 


Obter os valores de K e de p, de modo que os polos dominantes correspondam 
a uma resposta degrau com sobressinal de 16.3% e tempo de subida de 1s. 
3.15.30 Exercício: Realizações 


Obter uma representação no espaço de estados na forma canônica observável 
e também a função de transferência Y (s)/U (s) 


dy d2y dy dyu 
6 8— = 2u 4 3.630 
de aie ae O CORE 1980) 
3.15.31 Exercício: Realimentação de estados 
Considere um processo cuja função de transferência é 
10 
G(s) = 100 as (3.631) 


s3 + 3052 + 300s + 1000 


1. Obter uma realização {A3x3, B3x1,C1x3,Dixi} com a propriedade de 
que seja observável mas não controlável. 


2. Verificar se seria possível utilizar uma lei de controle tipo realimentação 
de estados u = —Kx + r, de modo que para r(t) do tipo unitário, a res- 


posta apresente sobressinal de aproximadamente 16% e tempo de subida 
de aproximadamente 1 s. 


3.15.32 Exercício: Resposta temporal à condição inicial não nula 


Esboçar o gráfico xo(t) x xı(t) para t > 0 do processo descrito por 


«=| o | (3.632) 


7 
sabendo-se que x(0) = | 0 1 ] 
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3.15.33 Exercício: Manutenção da controlabilidade sob realimentação 
de estados 


Considere as matrizes A e b de dimensões n x n e n x 1, respectivamente. 
Denotando por p(M) o posto (rank) da matriz M, mostrar que 


p [b| Ab|...,A"™-"b] = p|b| (A—bk)b|...| (A—bk)""'b] (3.633) 


para qualquer k de dimensão 1 x n. Qual a relevância dessa propriedade no 
contexto de sistemas de controle? 


3.15.34 Exercício: Magnitude de sinais de controle 


Considere o processo descrito por 


Ea 0 1 
aA BG 


| 10 |x (3.635) 


xE 


o | 7 (3.634) 


ts 
I 


T 
1. Obtenha uma lei de controle u(t) que a partir de x(0) = | 1 0 | em 
T 
t=0 atinja x(1) = | -1 0 | 


T 
2. Obtenha uma lei de controle u(t) que a partir de x(0) = | 1 0 | em 
T 
t =0 atinja x(10-10) = [ -1 0 | 


3.15.35 Exercício: Incertezas nos sensores 


Considere um processo representado no espaço de estados por 


o 0 1 0 
x = E EO NE (3.636) 
y = [a cy |x (3.637) 


em que cı e ca são ganhos associados aos sensores que monitoram os compo- 
nentes xı e £2 do estado, respectivamente. 


Os sensores apresentam incertezas, de modo que 
Gee +tAÃq t= 19 (3.638) 


sendo c?°™ o valor nominal informado pelo fabricante e Ac; a incerteza devida 
à fabricação. 
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Escolher a melhor opção em termos de precisão do observador de estados a 
ser implementado, considerando que há várias opções de sensores comerciais, 


conforme a tabela abaixo, porém com a restrição de que cı e c2 devem ser do 
mesmo fabricante. 


Marca CR Aca EB Ac 


Alfasense 10 0.1 1 0.2 
Betasense 5 0.2 5 0.2 
Gamasense 1 0.3 10 0.2 


4 


Modelos de tempo discreto 


“The events in our lives happen in a sequence in time, but in their sig- 
nificance to ourselves they find their own order the continuous thread 
of revelation.” 

— Eudora Welty 


Um exemplo tipico de sistemas de tempo discreto, doravante referido apenas 
como sistemas discretos, é a caderneta de poupança. 
Seja p[k] o recurso que um poupador possui em um certo banco, no més k. 


A dinâmica de p[k] pode ser representada por 
plk + 1] = (1 + p) p[k] + alk] — r[k] 


em que p é a taxa de juros + correção monetária, d[k| são os depósitos e r[k] 
os resgates. 


Ainda que os sistemas discretos sejam utilizados em uma ampla gama de apli- 
cações, aqui o foco será o controle por computador. 


4.1 Equações a diferenças 


Um sistema discreto pode ser modelado por uma equação a diferenças com 
recorrência, ou seja, os valores presentes da grandeza de interesse (y[k]) de- 
pendem dos seus valores anteriores e das excitações (entradas) u[k] 


yik] = Ff ylk o 1], ylk E 2), co y|k Fi n], u[k], ulk = 1], ulk qe 2), cep Uke a m], k ) 
(4.1) 
O maior atraso em y é a ordem da equação a diferenças, no caso, n. 
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Um exemplo de um sistema discreto (não linear) é 
ylk] = ylk — 1)? y[k — 2] + k sin(27 y[k — 1]) (4.2) 


Assim como no caso de EDO, o modelo é dito linear e invariante no tempo 
(LTI) se f é linear e não depende de k, ou seja, é da forma 


ylk] = —ayy[k — 1] — agy[k — 2] — ... — any[k — n]4 


AR 
+boulk] + byulk — 1] + boulk — 2] +... + bmulk—m] (4.3) 
eS eee SY 
MA 


em que a; € Re bj E€ R sao constantes, i = 1,2,....ne j =0,1,2,...,m. 


Na expressão do modelo, uma parte do valor de y[k] é a combinação dos valores 
anteriores de y[.] (autorregressão, auto-regression - AR), enquanto uma outra 
é a combinação dos valores recentes de ul.| em uma janela de tempo (média 
móvel dos últimos valores de uli], moving-average - MA). 


Modelos nessa forma são muitas vezes referidas como ARM A (Auto-Regressive 
Moving Average). 


1 


Denotando o operador atrasador por q” *, o modelo pode ser escrito na forma 


ylk] + aq tylk] + azg “ylk] +... + ang yk] 
= boulk]+big tulk] +... + bag ulk] (4.4) 


Definindo-se os polinômios 


1+ aq! + aq? +... + anq” (4.5) 
B(g!) = bo tbig t + bag? +... + bmg” 


D 
A: 
z | 

pa 
nd 

| 


o modelo de um sistema discreto pode ser expresso de modo compacto 


A(T Dylkl = B(q*)ulk] (4.7) 


4.1.1 Modelos no espaço de estados 


Uma equação a diferenças de ordem n pode ser reescrita como n equações de 
ordem 1. 


Para ilustrar o processo, considere o caso particular den = 4 e by = 0 


ylk] = —aylk — 1] — agy[k — 2] — asylk — 3] — asy[k — 4] + 
+byulk — 1] (4.8) 
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A condição bo = 0 significa que não há resposta instantânea y[k| a uma exci- 
tação ulk]. 


T 
Seja o vetor xp = | xılk] xo[k) xs3[k] x4[k] | , obtido mediante a associa- 
Gao 


xi[k] = yl[k —3] ;xo[k] = ylk — 2] ;xs[k] = ylk — 1] ; x4[k] = yk] (4.9) 


x(k] = y[k—3] =xe[k-1] (4.10) 
x(k] = ylk-—2]=x3[k— 1] (4.11) 
x3[k] = ylk- 1] = x4[k — 1] (4.12) 
xalk| = ylk] (4.13) 
= —aylk— 1] — aoylk — 2] — asylk — 3] — agy[k — 4] 4 
+byulk — 1] (4.14) 
em que a última linha pode ser reescrita substituindo-se y por x ou 
xk] = —a,xa4|k = 1] = a2x3|k = 1] = a3xq|k = 1] TEK a4Xılk = 1] + 
+b ulk — 1] (4.15) 
Em notação matricial, tem-se que 
0 1 0 0 0 
0 0 1 0 0 
x(k] = 0 0 0 1 x[k — 1] + 0 ulk — 1] (4.16) 
a4 a3 a2 ay bi 
SS SYS 
A B 
yk] = [0 0 0 1 kk (4.17) 
—— 


Observação: Caso bo £ 0, adiciona-se bou|k] na expressão da saída y[k] = 
Cx[k] + boulk] ou y[k] = Cx[k] + Dulk]. 


A equacao de estado é de recorréncia, 
x[k + 1] = Ax[k] + Bulk] (4.18) 
e dadas 


1. a condição inicial x[0] = xo e 
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2. a sequência de entradas (ul0],..., ulk — 1]} 


é imediato obter a expressão para um termo genérico x[k] na forma fechada 


x[1] = Axo + Bul0] (4.19) 

x[2] = Ax[1] + Bu[1] = A2?xo + ABul0] + Bull] (4.20) 

x[3] = Ax[2] + Bul2] = Aéxo + A?Bul0] + ABul1] + Bul2] (4.21) 
k-1 

x[4) = A*®xg+ 5 A*-!—Bufi] (4.22) 


i=0 
Exemplo de resposta a uma sequência degrau 


Considere o modelo de tempo discreto 


x[k +1] = | p E Jats $ | : | ulk] (4.23) 
yA] = [10 | ulk] (4.24) 


A resposta à sequência u[k] = 1 Vk encontra-se ilustrada na figura 4.1. 


Figura 4.1: Exemplo de resposta degrau de um sistema discreto. O Eixo da 
abscissa é o conjunto de números naturais. 


4.1.2 Estabilidade de modelos discretos 


Em vista de se ter 
x(k] = Ax (4.25) 
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o modelo será estável se |A; (Anxn) | < 1; i = 1,2,...,n ou, em outras palavras, 
se todos os autovalores de A estiverem contidos no círculo unitário no plano 
complexo. 


Se a saída de interesse é dada por y[k] = Cx[k], então 


k-1 
ylk] = CA*xy + X CAS! “Buli] (4.26) 
1=0 


e, para xo = O e entrada tipo pulso unitário (delta de Kronecker), 


1 k=0 
ulk] =| 0 40 (4.27) 
tem-se que a resposta é 
ylk] ai CA’ IB (4.28) 


Pode-se verificar que o modelo é BIBO estavel se a resposta a pulso é limitada. 


Seja entrada limitada | u[k] | < Mı, 0 < Mı < oo. A saída correspondente é 


k—1 
| vik] | = | 5 CA t-Bu; (4.29) 
i=0 
k—1 : 
< > | cat "B | m (4.30) 
1=0 


Se a resposta impulso é limitada, | CA*-1“B | < M2, 0 < Mə < oc, então 
k—1 
| ylk] | < 5 Mə Mı = k Mə Mı < œ (4.31) 
i=0 


4.1.3 Controlabilidade de modelos discretos 


A verificação da controlabilidade é imediata, pois se a ordem do modelo é n e 
são dados xo e xy, respectivamente o ponto inicial e o final desejados, 


xp — A”xo = A" !Bul0] + A” 2Bul1] +... + ABuln — 2] + Bu[n — 1] (4.32) 
de modo que se 


p| B AB .-- A”?B AB | =n (4.33) 
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pode-se determinar a lei de controle desejada {u[0], u[1], ..., u[n — 1]}. 
Porém, deve se ter cuidado, pois, por definição, controlabilidade se refere 
à capacidade de levar qualquer estado xo à origem. 


O modelo, x[k + 1] = Onxn X[k] + Bax1 ulk], segundo essa definição é contro- 
lável (logo, o termo atingibilidade é preferível em alguns casos). 


4.1.4 Observabilidade 


A verificação da observabilidade (capacidade de determinar xg a partir de 
medidas yļi], i = 1,2,...,n) também é imediata. 


Por simplicidade, seja {u[i]} = 0 e assuma que são fornecidas n medições, 


ylO] = Cxo (4.34) 
yll] = Cx[1] = CAxo (4.35) 
y[n] = Ca[n] = CA lx (4.36) 
Assuma que o posto 
C 
CA 
p i =n 
CAT 


Nesse caso, imediatamente, 


—1 


C y[0] 
CA ut 
Fo 
CAM! yin — 1] 


Em princípio, para obter o valor de x[k] de um modelo de ordem n, observável, 
basta que se disponha de n medições da saída, {y[k],...,y[k + n — 1]}. 


Porém, uma forma mais prática de se obter uma estimativa do estado é através 
do uso de observadores de estados. 


Observadores de estados são também conhecidos como Estimadores de Estado 
ou ainda como Observadores de Luenberger. 
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Nota-se que os modelos de estados no tempo contínuo e no tempo discreto 
são muito semelhantes. Enquanto no tempo contínuo tem-se e“t, no caso 
discreto tem-se A*. O efeito da excitação u continua sendo via convolução 
com integração f no caso contínuo e somatória >” no caso discreto. A região 
de estabilidade é o semiplano esquerdo no caso contínuo e o círculo unitário 
no caso discreto. Os testes de controlabilidade e de observabilidade são 
idênticos. 


4.2 Transformadas Z 


A solução de equações diferenciais ordinárias invariantes no tempo que mode- 
lam processos LTI pode ser estudada com o uso de transformada de Laplace. 


No caso de processos de tempo discreto, modelado por equações a diferenças, 
utiliza-se a transformada Z. 


Dada uma sequência { f[k] },=0,1,2,...a transformada Z (convenciona-se, usual- 
mente, denotar Z | f[k]] por F(z)) é definida por 


2 (FI) = sto 32) 
k=0 


O conceito de funções geradoras era conhecido há longa data (de Moivre, 1730) 
e foi reintroduzido em 1947 por Witold Hurewicz, sendo batizado de transfor- 
mada Z por Ragazzini, J.R. e Zadeh, L.A. da Universidade de Columbia em 
1952. 


Exemplo: Transformada de degrau discreto 


TEE: ioe (4.38) 


Diretamente da definição de transformada Z 


U(z) = Ag? hie ip Ag (4.39) 
1 
ei (4.40) 
zZ 
= 4.41 
a (4.41) 


Os modos mais simples para obter a transformada inversa de F(z) é a divisão 
longa e expansão em frações parciais, embora exista a fórmula de inversão. 
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4.2.1 Propriedades da transformada Z 


Embora existam muitas propriedades da transformada Z, restringe-se aqui 
àquelas mais utilizadas na Teoria de Controle. 


e Linearidade: Z[af[k| + 8g[k]] = aF(z) + BG(z) 


e Deslocamento no tempo: Z| f[k + 1Julk]| = zF(z) — zf10]. 
Em geral, propriedades de transformada Z são facilmente verificadas 
diretamente. 


No caso, considere as sequências 


fik] = flo), fi), fI2],. 4.42) 
fik] = fu], f], FBI, . 43) 
Constata-se imediatamente que 

F(z) = Z[f[k]] (4.44) 
= flo) + fa + F2? + f[B]e”*... (4.45) 
zF(z) = 2f[0] + fl + fz"! + fz... (4.46) 
Fiz) =. ZĪfĪk]] (4.47) 
= fi + fz! + F? (4.48) 

e, logo por inspeção, F(z) = zF(z) — zf[0). 

e Transformada da potenciacao: 

Zia") = a 2% 4a 2 ter? +... (4.49) 
= bas be PP +... (4.50) 
EEN (4.51) 


z—a 
e Teorema do valor final: 


fæ = lim(z — 1)F(2) 


e Transformada da convolução: (fx g)[k] = F(z)G(z) 


Mais detalhes, outras propriedades e tabela de transformadas Z podem ser 
encontradas, por exemplo, em (HEMERLY, 1996), (CADZOW; MARTENS, 
1970), (FRANKLIN; POWELL; EMAMI-NAEINI, 1986) e muitos outros tex- 
tos. 
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4.3 Modelo no domínio z 
Considere um modelo no espaço de estados 
x[k+1] = Axlk] + Bulk) ; ylk] = Cx[k] (4.52) 


Aplicando-se a transformada Z, tem-se que 


Z[x|k]] = Z[Ax[k| + Bulk)] (4.53) 
2X(2) —- 2x0 = AX(z) + BU(z) (4.54) 

ou seja, 
X(z) = (z1 — A)! xo + (21 — A)! BU (2) (4.55) 


Lembrando que y = Cx, tem-se que Y (z) = CX (z) e o modelo é descrito no 
domínio transformado por 


Y(z) = C(zI— A) xp +C (21-A) BU(z) (4.56) 
G(z) 


obtendo-se, como no caso de tempo contínuo, a função de transferência G(z) 
G(z) =C(zI- A)! B (4.57) 


Exemplo de função de transferência 


Considere o modelo de tempo discreto 


xk+1] = E ay [elit Es (4.58) 
dA he 
A B 
vb = [1 0 | x(k (4.59) 
— —_——- 
C 
Tem-se imediatamente que 
eO ma (4.60) 
= C(I-A)!B 4.61) 
z+1 


z2 —0.9z +0.2 
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4.4 Transformada inversa de Z 


Dadas a função de transferência G(z) e uma entrada U(z), tem-se imediata- 
mente que a saída, no domínio transformado, é dada por 


Y (2) = G(z)U(z) (4.63) 


assumindo condições iniciais nulas. 

Para obter a sequência de saída y[k] = Z-![Y(2)], pode-se utilizar o mesmo 
método apresentado no caso de tempo contínuo, ou seja, expansão em frações 
parciais com termos típicos: 


e Z| [d[k]] =1 (delta de Kronecker) 


e Z`! [u[k]] = 4+ (degrau unitário) 


e 27! [cos(kw)ulk]] = oii 


r z—! sin(w 
ai Z [sin (kw)u[k]| = sr 


Exemplo 


í . o E reais Ro 1 
Seja um processo cuj a função de transferência é G(z) = =-y3701 € à entrada 
ujk] é um degrau unitário. 


Lembrando que Z[ulk]] = £,, tem-se que 
1 2 
Y = 4.64 
(a) 2-032-01 2-1 e 
z 
— 4.65 
(z — 0.5)(z + 0.2)(z — 1) ee) 
—1.4286 —0.2381 1.6667 
" | 4.66 
En ge z-—1 
Pela tabela, Z[a*] = +, de modo que 
ylk] = z-HY(2)] (4.67) 
—1.4286 —0.2381 1.6667 
= z! + | (4.68) 


z—0.5 z + 0.2 z—1 
= —1.4286z(0.5)¥7! — 0.2381z(—0.2)¥7! + 1.6667 k > 1 (4.69) 
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Pausa para relembrar conceitos importantes: No caso contínuo, utilizava-se 
a transformada de Laplace e no caso discreto a transformada z. Nota-se 
que L{ f(t) } = [5° f(r)e~*” dr enquanto Z( f[k]) = So f[ilz*, de modo 
que se observa, novamente, exponenciação e integração no caso contínuo e 
potenciação e somatória no caso discreto. 


4.5 Alguns textos históricos 


John Ralph Ragazzini (1912-1988) é considerado o 

pioneiro na área de sistemas de controle para mode- P 
los de tempo discreto. 

Junto com Lotfi Aliasker Zadeh (1921-2017), apre- 

sentado mais à frente na seção que trata de conjun- 

tos nebulosos, propôs, em 1952, a transformada Z. 


tes 


Figura 4.2: J. R. Ra- 
gazzini. 


Entre os livros mas antigos sobre controle de mode- 
los discretos estão: 


e Ragazzini, J. R. e Zadeh, L. A. The analysis of 
sampled-data system. Transactions of the American Institute of Elec- 
trical Engineers, Part II: Applications and Industry, v. 71, n. 5, p. 
225-234, 1952. 


e Jury E. I. Theory and Application of the Z- 
Transform Method. John Wiley and Sons, 1964. 
4.6 Exercícios 


4.6.1 Exercício: Sequência de Fibonacci 


Considere a equação a diferenças (que gera a sequência de Fibonacci) 


ulk] = ulk-—1]+ulk — 2] (4.70) 
ufo] = 0 (4.71) 
ull] = 1 (4.72) 


Escrever o termo geral na forma 


ulk] = AF + a2A§ (4.73) 
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4.6.2 Exercício: Resposta à condição inicial 


Obter uma expressão para o termo genérico y[k] 


ylk] + 0.3y[k — 1] — 0.4y[k —2] = 0 (4.74) 
yo) = 1 (4.75) 
yl] = -1 (4.76) 


4.6.3 Exercício: Resposta à entrada delta de Kronecker 


Obter uma expressão para o termo genérico y[k] de 


ylk] + 0.3y[k — 1] — 0.4y[k — 2] = uk — 1] (4.77) 
yo] = 0 (4.78) 
yl] = 0 (4.79) 


sabendo-se que a excitacao é caracterizada por 


ulk] = : ar (4.80) 


4.6.4 Exercício: Resposta à excitação degrau 


Obter uma expressão para o termo genérico y[k], sabendo-se que ulk] = 
1,Vk>0 


ylk] + 0.3y[k — 1] — 0.4y[k — 2] = ulk — 1] (4.81) 
yo] = 0 (4.82) 
yll] = —0 (4.83) 


4.6.5 Exercício: Resposta à excitação rampa 


Obter uma expressão para o termo genérico y[k], sabendo-se que ulk] = 
k, Vk > 0 (Entrada u tipo rampa) 


ylk] + 0.3y[k — 1] —0.4y[k — 2] = ulk — 1] (4.84) 
0) = 1 (4.85) 
yi] = -1 (4.86) 
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4.6.6 Exercício: Resposta à condição inicial 


Obter uma expressão para o termo genérico y[k] 


yik] + yk-1]+05yk-2]=0 (4.87) 
ylo) = 1 (4.88) 
af = Sd (4.89) 


4.6.7 Exercício: Transformada inversa em Z 


Obter e[k] aplicando a transformada inversa em Z 


di 
o z(z—1) 
E(2) = 37 352 $0.05 
A 
Biaje z2 —2z+1 
3. 
EU Neri 
4. 
DOS 0.5z 
(z — 1)(z — 0.5) 
i feto 0.5 
() = Grae 08) 
6. 
Ele 0.5(z + 2) 
A= Te = OD) 
É 7 0.5 
) = FoS 057 
8. 
BOE 0.5(z + 0.5) 


(z — 0.5) 
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4.6.8 Exercício: Espaço de estados 
Colocar na forma de espaço de estados, 
x/k+ 1) = Ax[k] + Bulk (4.90) 
ylk] = Cx (4.91) 
as seguintes equações a diferenças 
1. y[k] — 1.5y[k — 1] + 0.56 y[k — 2] = uf[k — 1] 
2. ylk] + ylk — 1] + ylk — 2] + ylk — 3] = 5ulk—1] 


3. ylk] — 1.5 y[k — 1] + 0.56 y[k — 2] = u[k — 1] + 0.2 u[k — 2] 


4.6.9 Exercício: Função de transferência discreta 
Obter a função de transferência Y(z)/U(z) a partir da equação a diferenças 


1. ylk] — 3y[k — 1] + 2 ylk — 2] = 2u[k — 1] 


2. ylk] — 1.5 ylk — 1] — 0.56 y[k — 2] = 2 ulk — 1] — 1.12 u[k — 2] 


4.6.10 Exercício: Função de transferência discreta 


Obter a função de transferência T(z) = não: 


0 1 0 0 0 
o 0 1 0 0 
x[k] o 0 o q lxk-0+ o [uk-1] (492) 
-02 -04 01 08 0.1 
ylk] = [0011 |x[b] (4.93) 


4.6.11 Exercício: Estabilidade 


Indicar para que valores de a os seguintes modelos são estáveis: 


2. G(z) = Fe 
3. ylk] — 0.7y[k — 1] + ay[k — 2] = ulk — 1] 


4. ylk] — 0.7y[k — 1] + a ylk — 2] = ulk — 1] — 2u[k — 2] 


5 


Identificação de modelos 


“All identification is for control and ownership..” 
— Bryant McGill 


Identificação, no contexto desta obra, é o processo de construir um modelo para 
um dado sistema a partir dos registros de pares entrada-saída, { u(t), y(t) Ho<t<ty 
ou { ul], ylk] ko<ko<k,- 

Em geral, podem ser agrupadas em duas categorias. 


1. Identificação paramétrica: tendo-se escolhido a estrutura do modelo, 
os seus parâmetros são estimados a partir dos dados disponíveis. Por 
exemplo, se a estrutura escolhida é um sistema LTI de segunda ordem, 
busca-se estimar É e wn. 


2. Identificação não paramétrica: a partir dos pares entrada-saída, busca-se 
diretamente um mapa que os relacione. Por exemplo, um algoritmo de 
aprendizado pode ser utilizado para ajustar uma rede neural artificial 
que represente esse mapa entrada-saída. 


5.1 Métodos elementares 


Sistemas simples, por exemplo, do tipo LTI de uma entrada e uma saída, 
podem ser identificados por experimentos simples, como: 


e Excitar o processo com sinais u(t) do tipo degrau e observar a resposta. 
Caso a resposta se aproxime àquela característica de 2º ordem, o so- 
bressinal, o tempo de subida e o erro em regime permanente permite 
determinar K, € e wn de 


T(s) = E 


s2 + 2Ewns + w2 


(5.1) 
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e Excitar o processo com sinais senoidais em uma ampla faixa de frequên- 
cias e ajustar assíntotas às curvas de Bode. 


e Excitar o processo com um ruído branco e obter o gráfico da função 
de correlação cruzada entrada-saída. Estando u(t) e y(t) na condi- 
ção de estacionaridade no sentido amplo, a resposta impulso do pro- 
cesso é dada por h(t) = Ruylt), em que Ry,(t) = Elu(r)y(7 — t)] = 
A JE u(T)y(T — t)dr para T suficientemente grande. O detalhamento 
deste método foge ao escopo deste livro e os interessados são referidos aos 
textos (AGUIRRE, 2015b), (EYKOFF, 1974), (GOODWIN; PAYNE, 
2012) e (LJUNG, 1998). 


5.2 Identificação de modelos de tempo discreto 


Neste capítulo são tratados apenas os métodos paramétricos, ou seja, a es- 
trutura do modelo é assumida conhecida e os seus parâmetros são estimados 
através das medidas das entradas e as correspondentes saídas. 


Com a intensificação do uso de equipamentos digitais em controle, a identifica- 
ção de modelos de tempo discreto tem ganhado cada vez mais espaço na teoria 
e aplicação de sistemas de controle, competindo com métodos de discretização 
de modelos obtidos invocando leis físicas. 


A leitura deste capítulo requer alguns conhecimentos básicos da teoria de pro- 
babilidade e de processos estocásticos que pode ser encontrado em livros textos 
tais como (PAPOULIS, 1984), (GNEDENKO; KHINCHIN, 2013) e (DUR- 
RETT, 2019) 


1. Dado um espaço de probabilidade (Q, F, P), uma variável aleatória real 
é uma função X : Q —> R ou X(w) com w € Q. Porém, aqui e como em 
muitos textos, o argumento w é omitido. 


2. O valor esperado de uma variável aleatória X é definido como 


EX] 


I, X(w) P(dw) (5.2) 
f Etxea (5.3) 
R 


em que fx é a função densidade de probabilidade de X (£ é apenas uma 
variável de integração). 


3. Variáveis aleatórias X normalmente distribuídas, denotadas por X ~ 
N(u,o2), são as que possuem densidade de probabilidade fy expressa 
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por 
1 -3 (2)? 

L): =! Se 248 5.4 

4. Uma sequência i.i.d. de variáveis aleatórias { X[0], X[1],...) é aquela 


em que X[i] e X[j] possuem distribuições idênticas e, além disso, X[i] e 
X [j] são variáveis aleatórias independentes, Vi Æ j. 


5. Quando as variáveis X e Y possuem distribuição normal, a não correla- 
ção (corr(X,Y) = 0) implica independência. 


6. A notação utilizada para a matriz de covariança é cov(X) = E[(X — 
E[X])(X — E[X])*] 


7. Quando duas variáveis aleatórias X e Y são correlacionadas, o conheci- 
mento de Y afeta a probabilidade de X. Assim, a esperança condicional 
de X dado Y é denotada E[X|Y] (que é uma nova variável aleatória). 


5.2.1 Estimador de mínimos quadrados 


Neste módulo será apresentado apenas o caso de estimação de parâmetros de 
uma classe de modelos lineares utilizando o método dos mínimos quadrados. 


Considere um sistema SISO descrito por 


A (1) ylk] = B (a) uk] + wik] (5.5) 

em que A e B são polinômios em q | 
A (a) = 1+aq™! +.. + ang” (5.6) 
B ("') = bo +big t +... + bmg ™ (5.7) 


eq ! representa o operador atrasador unitário, y[k] é a saída, u[k] é o sinal de 


entrada e w[k] ~ N(0,1) são ruídos independentes identicamente distribuídos 


Essa expressão pode ser colocada em uma forma mais conveniente 
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Suponha que os registros dos sinais de saída e da entrada, respectivamente, 
{y[0}, ..., y[N]} e {uf0],...,u[N]} com N > n são fornecidos. 

Então, empilhando-se as expressões 5.8 com y[N] no topo e decrescendo até 
y|n], tem-se que 


T 
Y=[ IN] yiN-1] yin] | 
T 
esl ae oe ay Oy a gl (5.9) 
T 
W= | wN] w[N-1] win] | (5.10) 
-N =] e yN=n) [aN e uN- m] 
—yN-2) --- -y[N-n-1]|u[N—-1] --- ulN-m-]] 
A= i . A . 
-yn =) + yfo un) > ulm — mr 
(5.11) 
tem-se a representação compacta 
Y=A0+W. (5.12) 


A matriz A é (N —n +1) x (n+ m+1) com N-n+1 > n+m+l1, ou seja, 
o sistema possui muito mais equações do que incógnitas e não haveria como 
satisfazer todas elas simultaneamente. 


As inconsistências são, em geral, devidas aos ruídos w[k] desconhecidos. 


A ideia, portanto, é utilizar o método dos mínimos quadrados, de modo que, 
quando o comprimento dos registros N é grande, o efeito do ruído é reduzido. 


O valor de O que minimiza ||Y — Aol, denotado 0, deve satisfazer a condição 


d 
—|Y-A 
+ IY- Ad] 


=0 (5.13) 
0-8 


Desenvolvendo o lado esquerdo dessa condição, obtém-se que 


d 


— (Y — Ao)" (Y — A9) = 0 (5.14) 
do E 
6=0 
Li (YTY -2YTA9 + 67ATAO) = 0 (5.15) 
do a 
(-2ATY +24740)) ` = 0 (5.16) 
6=0 
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A expressão de 0 que minimiza o erro quadrático é, portanto, 
A -1 
= (ATA) ATY (5.17) 


Essa é a expressão do EMQ (Estimador de Mínimos Quadrados ou Least Squa- 


-1 
res Estimator - LSE) e a matriz AÍ = (ATA) AT é conhecida como a 
pseudoinversa de Moore-Penrose de A. 
Algumas propriedades do EMQ (LSE): 


e Uma estimativa O de O é dita ser não polarizada se E [6] = 0. 


gfe] = EI(ATA) ATY (5.18) 
= E\(A™ A)” (AT AO +w)) (5.19) 
= EI(ATA) (ATA) e+ (ATA) w] (5.20) 
= BI(ATA) (ATA)| o+ (ATA) Ew’ (8.21) 
-0 (5.22) 


e cov(0) = (ATA)! 
A —1 
Lembrando que 0 = (ATA) ATY e Y = AH + W, pode-se escrever 


aS 
D 
| 
Es 
2 
D 
| 
Es 
D 
E 
II 


EMATAJIAIWWTA(ATA) |] 
(ATA) IATEIWWT]AATA)! 

= (ATA) TATA(ATA)! 
(ATA)! (5.23) 


e Teorema de Gauss-Markov: 


A estimativa obtida pelo MQE, 0, é ótima na classe de estimadores 
lineares não polarizados (ou se 6 = AY tal que E[6] = 0,V0, então 
cov(8) < cov(6)). 


Note, inicialmente, que 


o=E[6) = E(ÁY] (5.24) 
= E[Á(AO +W)] (5.25) 
= ÁAO+4 E[W] (5.26) 
= AAO (5.27) 
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Em vista de © = AAO, conclui-se que AA = I e, por outro lado, 


co(Ã) = El(6 — E[6))(6 — E[6))7] (5.28) 

= BU AY ox - 9)7] (5.29) 

= EIAWWTAT] (5.30) 

= AAT (5.31) 
uma vez que 

ÁY-0 = Á(AO+W)- 0 (5.32) 

= (ÁAJO+ÁW-O (5.33) 

= 0+AW-O (usando AA =I) (5.34) 

= AW. (5.35) 

Seja agora A definido por A = A— (A7A)—!A7 e note que AA =0 
pois AA =I. 

Lembrando que havia sido mostrado que cov(A) = AA”, tem-se que 

cou(A) = AAT (5.36) 

= [A +(ATA) ATIA + (ATA) TATO (5.37) 

= AAT+(ATA)! (5.38) 

= AAT + cov(6) (5.39) 


Logo, cov(6) > cov(0), pois AAZ > 0. 


e O teorema de Gauss-Markov permite concluir que a estimativa @ é BLUE 
- Best Linear Unbiased Estimator. 


5.2.2 Regiões de confiança para EMQ 


A identificação paramétrica de modelos resulta em incertezas quando há pre- 
sença de ruído. 

Assim, é importante que se estime a região de confiança das estimativas com 
algum grau de significância. 


Por exemplo, saber que um parâmetro possui dispersão de 10.0 + 0.1 permite 
a realização de um projeto melhor do que no caso de 10.0 + 1.0. 


Assuma que se está utilizando o método do EMQ, caracterizado por 


Y = A0+W (5.40) 
6 = (ATA) TATY (5.41) 
W = Y-Aô (5.42) 


em que W ~ N(0,021). 
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Caso com o conhecido 
Sabendo-se que cov(6) = (A7A)~!, tem-se 
(8 — 0) ~ N(0,02 (ATA)!) (5.43) 


Logo, adotando se a faixa de significância de 0.95, e denotando P = (ATA), 
tem-se 


0; € (0; — 20 /Pa, O; — 20/Pa) (5.44) 


Caso com o desconhecido 


Agora, não somente o 0, mas também o? deve ser estimado: 


N-m+1 
alk]? (5.45) 
k=1 


1 
AQ 
° 2 N-m 


Necessita-se, ainda, dos seguintes resultados auxiliares (WITTE; WITTE, 
2017): 


e “Se {ulk]},-19. wv é tal que ulk] ~ N(0,1), então E. ulk] ~ x5” 


e “Se u ~ N(0,1)eu~ XA, então 


u 
= (5.46) 
Ve 
tem distribuição t de estudante com N graus de liberdade (ty)” 
Faça-se a associação 
6. = 6; 1 Nome ; 
u= e v= — wlk 5.47 
= z > a (5.47) 
Nessas condições, u ~ N(0,1) e v ~ x4.,€ 
0; — 0; 1 
= a — (5.48) 
NR Oy Pii (= ra w[k]2 
N-m 
0; — 0; 1 
e ee (5.49) 
Dii Noy wl? 
N-m 
6. 0; 
= ae (5.50) 
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Consultando-se tabelas estatísticas, pode-se obter ka correspondente à região 
de confiança com nivel de significância alpha da distribuição ty-m- 


O valor verdadeiro estaria com significância @ em 
0; = (6, — kav Pio, 0; + kav pid) (5.51) 


Observação: Existem outros métodos de estimação de parâmetros, tais como 
o da máxima verosimilhança (maximum likelihood) e MAP (máximo a priori). 


5.2.3 Mínimos quadrados recursivos 


A expressão (ATA) 1A” não é conveniente pois a estimativa Ô no instante 
k + 1 teria que ser recalculada usando todos os pares (ylil, ulil) para i = 
0, k +1. 


Se 6[k] é a estimativa com as informações {y[0}, ..., y[k]} e {u0],..., ufA]}, a 
ideia é obter 0[k + 1] a partir de O[k], y[k + 1], ulk + 1]. 
Seja a matriz P, definida por 


P; = (ATA) (5.52) 


em que Ay é construída a partir de {y[0],...,y[k]} e {uO}, ..., u[A]}. 


A matriz Az. possui uma linha a mais do que Ax, ou seja, 
A 
Ap = | i | (5.53) 


Analogamente, agrega-se a nova medida y[k + 1] ao vetor Y% 


Yk 


ylk +1] (5.54) 


Yeu = 


Lema de inversao de matrizes: 


Sejam Mpxn, Dnx1 € Cnx1 tais que det (M + be”) *0el+ cT Atb #0. 


Nestas condições pode-se mostrar que 
Re -1 Tarada TA 
(M+bc") =M- (1+c"M'b) MobeM (5.55) 


—1 
A ideia é utilizar esse lema para reescrever (AT Ar) 
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A matriz de covariança do erro é dada por 


Pri = (AfaAm). (5.56) 
1 
A 
= ( A, ap | Fa | (5.57) 
k+1 
-1 
= (ATA +anara) (5.58) 
P T 
= i Sa ae po (5.59) 
(1 + af, Pran) 
uma vez que ap, Parsi é um escalar. 
Por outro lado, 
z =i 
Ok +] = (AfnAry) Aga Yeu (5.60) 
= (AkmArn) | AP arm | isa (5.61) 
4 Y 
= (ASA, + akiak) | Ag aky ] ME (5.62) 


T 
Papa, 


rca 


P; (ALY: + agyiylk + 115.63) 


T 
Pkak+1aġ41 EN 


(1 + af, Prans) 


I 
D) -m— 


P E 
[k] + dot (yk+1]-afnôle) (5.65) 
(1 + af, Praky) 


Para a última passagem, usou-se a seguinte simplificação 


T 
Pkak+1aġ41 


I 
(1 + ag, Pears 


Prag iylk + 1] = Pragyiylk + 1] (5.66) 


ja que 
escalar escalar 


T T 
agi Parsi Pragsiylk + 1] = Pkak+ı agi: Prarci ylk + 1] (5.67) 


162 Engenharia de controle 


Definindo-se 
= 
Kyi = PrAns (1+ akp Peary) (5.68) 


nota-se que a expressão do EMQ recursivo é a mesma do filtro de Kalman. 


inovação 
— A, 
dk +1]) = lk] + Ken (vlk + 1] - af, 014) (5.69) 


A matriz de covariança do erro é dada recursivamente por 
Pa = [[-Ken Ags] Ps (5.70) 
Observação: 


e Modelos tendem a variar com o tempo, mesmo que lentamente, de modo 
que dados “antigos” podem não contribuir para melhorar a estimação. 


e Uma solução é “esquecer” as medidas antigas utilizando o forgetting fac- 


tor0<A<1: 
ps x P = 
@[k + 1] = Ole] + E ylk + 1) -afm ôlk]) (5.71) 
(1 +à af, Pran) 
Exemplo 


Considere o modelo de tempo discreto 


0 0 0.12 1 

xk+1] = |1 0 —0.74 | x[k]+] 0 | u (5.72) 
0 1 1.5 0 

ylk] = [o 0 1 | x[H] (5.73) 


cuja representação na forma ARMA é 
ylk + 1] = —1.50y[k] + 0.74y[k — 1] — 0.12y[k — 2] + 1.00u[k —2] (5.74) 


Aplicando-se o método de identificação por mínimos quadrados recursivos, 
obtém-se o gráfico da figura 5.1. 
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Identificação Recursiva MQ 


Figura 5.1: Identificação pelo método de mínimos quadrados recursivos. 


5.3 Identificação pelo método do subespaço 


A partir de medidas de sinais de entrada u[k] e de saída y[k], deseja-se estimar 
o modelo SISO no espaço de estados {A, B, C, D} 


x[k +1) = Ax[k] + Bulk] (5.75) 
ylk] = Cx[k] + Dulk] (5.76) 


em que x[k] én x 1. 


Supondo x[k] e {u[k]} conhecidos, pode-se escrever 

x[k+1] = Ax[k] + Bulk] (5.77) 

x[k+2] = Ax[k+ 1] + Bulk + 1] 
= A?x[k] + ABulk] + Bulk + 1] (5.78) 

x[k+3] = Ax[k+ 2] + Bulk + 2] 
= A°x{k] + A?Bulk] + ABulk + 1] + Bulk +2] (5.79) 

NA 
x[k+N) = A”x[k]+ > AN} Bulk + il (5.80) 


i=0 
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Portanto, multiplicando-se por C à esquerda, tem-se que 


ylk] = Cx[k] + Dulk) (5.81) 
ylk+ 1) = CAx[k] + CBulk] + Dulk + 1] (5.82) 
ylk+2] = CA?x[k] + CABulk] + CBulk + 1] + Dulk + 2] (5.83) 
ylk+3] = CA?x[k] + CA?Bu[k] + CABulk + 1] + CBulk +2] + 
+Dulk + 3} (5.84) 
N-1 
y[k+N] = CANx[k + X CAN “Bulk +i] + Dulk+N] (5.85) 
1=0 


Para simplificar a notação definem-se Yn, Vn, Hn e UN 


y[k] C 
ylk + 1] CA 
ylk + 2] = CA? x(k] 
ylk + N] CAN 
a Ne a 

Yn Vn 

D 0 0 0 ulk] 

CB D 0 0 ulk + 1] 

j: CAB CB D < 0 ulk + 2] 

CAN-IB CAN-2B CANB ... D || ulk+N] 

7 Hy Un 

(5.86) 


de modo que em notação compacta, para cada instante k, tem-se 
Yn = Vy x[h] + HyUN (5.87) 


A matriz Vw possui uma estrutura que lembra a matriz de observabilidade e 
os elementos da matriz Hy contém respostas impulso CAB. 

Os parâmetros a serem estimados são Vy e Hy. 

A ideia é coletar dados desde o instante k até k + N, com N suficientemente 


grande para que se possa aplicar, por exemplo, o método dos mínimos qua- 
drados. 
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Agrupando-se lado a lado os Yy correspondentes a x[k] e Uy para vários 
instantes k, podem ser construidas as matrizes de dados Y e U, na forma 


y[k] ylk+1] > ylk+M] 
ylk + 1] ylk + 2] e yk+M+1] 
y = | yvk+2] 0 ylk+3)  yk+MA+2] (5.88) 
ykK+N] yk+N+HI] --- yk+M+N] 
ulk] ulk + 1] or ulk + M] 
ulk + 1] ulk + 2] ce ulk+M +1] 
U = ulk + 2] ulk + 3] “ ulk+ M +42] (5.89) 
ulk+N] uk+N+1) --- ulk+M+N] 
Definindo-se 
X=[x{k] x[k+1] o x[k+ MM] | (5.90) 
pode-se escrever utilizando-se as definições de Y eU 
Y=Vyx+HyU (5.91) 


Se x é medido, então a obtenção de Vy e Hy a partir de 5.91 poderia ser 
feita diretamente pelo método de mínimos quadrados. 

Porém, se x não é disponível, então o problema de estimar Vy e Hy a partir 
de 5.91 é mais intricado e foge ao escopo deste livro. 

Um tratamento sistemático desse caso pode ser encontrado em Qin, S. J. An 


Overview of Subspace Identification. Comp. and Chemical Engineering., v. 
30, 2006, p. 1502-1513. 


Embora existam métodos não paramétricos, como o dos casos que empregam 
redes neurais artificiais, que permitem casar modelos (model matching) 
à relação entre os registros de entradas e saídas, esta seção buscou a iden- 
tificação de parâmetros de modelos na forma de equações a diferenças. É 
importante ressaltar que uma identificação acurada e precisa requer ade- 
quada quantidade de informações também acuradas e precisas. 


5.4 Algumas notas históricas 


Em 1809, Johann Carl Friedrich Gauss (1777-1855) publicou um trabalho que 
apresentava um tratamento sobre o método dos mínimos quadrados sob a hipó- 
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tese de erros normalmente distribuídos. (Gauss, J. C. F. Teoria de movimento 
de corpos celestres movendo em secções cônicas ao redor do sol (em latim). 
Friedrich Perthes e I. H. Besser, Hamburgo, 1809). 


Porém, em 1805, Adrien-Marie Legendre (1752-1833) já tinha publicado um 
livro em que o método de ajustar curvas a uma série de dados era apresentado 
no apêndice (Legendre, A. M. Novos métodos para a determinação de órbitas 
de cometas (em francês). F. Didot, 1805. 


Um fato curioso é que o retrato de Legendre que tem circulado em variados 
meios de publicação é, em verdade, do político Louis Legendre (1752-1797), 
não sendo do matemático Adrien-Marie Legendre. 


Em 1821, Gauss apresentou uma prova do teorema de Gauss-Markov que mos- 
tra a otimalidade do método de mínimos quadrados, conforme a primeira parte 
da sua obra: Gauss, C. F. A teoria da combinação menos afetada por erros de 
observação (em latim). Societas Regia Scientiarum Gottingensis, 1821. 


O teorema foi redescoberto em 1900 por Andrey Andreyevich Markov (1856- 
1922), famoso pelos processos de Markov (Markov, A .A. Extensão da lei dos 
grandes números para quantidades dependentes (em russo). Izvestiya Fiziko- 
matematicheskogo obschestva pri Kazanskom universitete, v.15, 1906, pp. 135- 
156. 


Em 1933, Andrey Nikolaevich Kolmogorov (1903-1987) publicou o livro que 
estabeleceu uma formulação axiomática para a Teoria de Probabilidades (Kol- 
mogorov, A. Foundations of the probability theory (em alemão). Julius Sprin- 
ger, 1933). 


Uma excelente referência na língua portuguesa é (AGUIRRE, 2015b) e, na 
língua inglesa, (LJUNG; SODERSTROM, 1984). 


Markov 
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5.5 Exercícios 


5.5.1 Exercício: Ajuste de retas usando o método de mínimos qua- 
drados 


Assuma que em algum experimento de laboratório é sabido que 
y=ar+b (5.92) 


em quexE€ ReyeER. 


Repetindo-se o experimento N vezes, obtém-se um conjunto de pares entrada- 
saída 


C = {(21, y1), (22,42), 5 (EN, YN)) (5.93) 


Devido a erros de medida, cada par (2;, yi) possui uma incerteza aditiva w;. 


Ao invés de marcar os pontos em um papel milimetrado e ajustar a reta que 
mais aproxima esses pontos usando uma régua, mostrar como o método dos 
mínimos quadrados pode ser utilizado para obter as estimativas q e b. 


Observação: O conjunto de medidas satisfaz: 


yı Tı wI 

Aa? l+ j (5.94) 
: : b : 

YN TN WN 

Y A 


5.5.2 Exercício: Identificação paramétrica pela resposta degrau 


Um certo sistema linear invariante no tempo, de 2º ordem, sem zeros, foi 
ensaiado no laboratório injetando-se na entrada um sinal u(t) do tipo degrau 
unitário. A saída y(t) correspondente encontra-se na figura 5.2. Esboçar a 
saída y(t), em regime permanente (t 1 00), quando o sinal de excitação u(t) é 
agora de forma senoidal, u(t) = 5 sin(2t). 


5.5.3 Exercício: Identificação paramétrica pelas curvas de Bode 


Excitou-se um sistema LTI de segunda ordem com um gerador de sinais se- 
noidais e com o auxílio de um osciloscópio, e traçaram-se as curvas de Bode 
da figura 5.3. Apresentar modelos desses sistemas na forma de uma função de 
transferência. 
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Resposta à Entradda Tipo Degrau Unitário 


Saída y(t) 


Figura 5.2: Resposta degrau de um sistema de segunda ordem. 


5.5.4 Exercício: Método dos mínimos quadrados 


Aplicou-se um sinal u[k] em um sistema de tempo discreto LTI de segunda 
ordem e registrou-se o sinal de saída y[k]. O registro dos sinais encontra-se na 
tabela a seguir. 


Tabela 5.1: Registros de pares entrada-saída de um sistema LTI de segunda 
ordem 


ulk] ylk] 
1.000000 0.700000 
0.830258 -0.439742 
0.933023 0.791610 
1.110557 -0.094803 
1.207818 0.519340 
0.776472 -0.370270 
1.252132 1.115390 
1.132029 -0.609886 
0.986427 0.756670 
0.960956 -0.181629 
0.956479 0.448792 
0.939378 0.021957 
1.004609 0.376130 


nm 
ME eCamarnnaanrwnror 


Ha 
N 


Identificar os parâmetros do modelo na forma ARMAX utilizando o método 
da batelada (usando a pseudoinversa de Moore-Penrose). 
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Exercício de Identificação: Sistema de Segunda Ordem 
10 p EE: —— at m= 


Magnitude (dB) 


10 10° 10 
Frequency (rad/s) 


Figura 5.3: Curvas de Bode - Sistema LTI de 2° ordem. 


5.5.5 Exercício: Identificação 


Excitou-se um sistema LTI de segunda ordem com um gerador de sinais se- 
noidais e com o auxílio de um osciloscópio, traçou-se as curvas de Bode da 
figura 5.4. Apresentar modelos desses sistemas na forma de uma função de 
transferência. 


5.5.6 Exercício: Método do EMQ recursivo 


Repetir o exercício anterior, utilizando-se, porém, o método dos mínimos qua- 
drados recursivo. 


5.5.7 Exercício: Região de confiança da estimativa 


Estimar a região de confiança das estimativas obtidas no exercício anterior. 


5.5.8 Algumas observações 


O campo de estudos de métodos de identificação é extenso e vários conceitos 
e técnicas importantes estão omitidas neste capítulo. 


Por outro lado é comum que, na prática, a modelagem e identificação ocupem 
recursos e esforços substanciais em um projeto de sistema de controle. 


Em alguns projetos de maior porte, o dispêndio na obtenção de um modelo 
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Exercício de Identificação: Sistema de Segunda Ordem 
20 r a : : ii 


Magnitude (dB) 


Phase (deg) 


107 10° 101 102 10? 
Frequency (rad/s) 


Figura 5.4: Curvas de Bode - Sistema LTT de 2º ordem. 


confiável pode vir a significar uma fatia substancial do orçamento. 


Por exemplo, no projeto de aeronaves, há eventuais gastos com testes em túneis 
de vento ou CFD estensivo, construção de ironbirds, construção de modelos 
em escala, construção de protótipos instrumentados e ensaios em voo, entre 
outras possibilidades. 

Recomenda-se, portanto, aqueles que se interessam por esse tópico, a leitura 
de obras tais como (AGUIRRE, 2015b), (COELHO; COELHO, 2016), (GO- 
ODWIN; PAYNE, 2012) e (LJUNG, 1998). 


Parte III 


Estabilidade 
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6 


Critérios de estabilidade para 
modelos LTI 


“The cost of stability is often diminished opportunities for growth.” 
— Sheryl Sandberg 


Conforme visto anteriormente no Capítulo 3, um ponto de equilíbrio xg de 
x = f(x) é dito ser estável se, dado ô € R arbitrário, existe e(ô) € R tal que 
se || x(to) — xg || < ô, então || x(t) — xg || < e(ô) para Vt > to. 


Sistemas lineares invariantes no tempo 
x = Ax (6.1) 


possuem um único ponto de equilíbrio xg = O se A é não singular, mas 
infinitos pontos {xg € Ker(A)} se det(A) = 0 e constituem um subespaço do 
espaço de estados. 


Observação: 


Sistemas não lineares podem ter múltiplos pontos de equilíbrio isolados. 


Por exemplo, o sistema escalar 
t=r-r’ (6.2) 


possui três pontos de equilíbrio: 0, —1 e +1. 
A solução de modelos LTI 


x = Ax ;x(to)=xo (6.3) 
y = Cx (6.4) 
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é da forma : 
y(t) = une! (6.5) 
k=1 


e são estáveis se os todos os autovalores A; possuem parte real negativa. 


No dominio transformado, tal fato se traduz na condição que todos os polos 
da função de transferência estão localizados no semiplano esquerdo (SPE). 
Uma vez que a obtenção das raízes de A(s) pode ser trabalhosa, principalmente 
quando são envolvidos parâmetros literais, é interessante que se disponha de 
métodos para verificar se todas as raízes do polinômio característico A(A) = 
0 estão localizados no semiplano esquerdo (nesse caso, A(A) é dito ser de 
Hurwitz). 


Neste capítulo é tratado apenas o caso SISO (single input single output). 


Observação 


A pertinência das raízes de A(s) ao SPE não garante a estabilidade de sistemas 
variantes no tempo (sistemas não autônomos). 


Considere o sistema cujo modelo é 


Ly = —T1— e” To (6.6) 
£2 = —T? 6.7 
com a condição inicial x = [0 1]7 
A solução de t2 = —x2 é £2(t) = e tx9(0), ou substituindo x2(0) = 1 
z(t) = e™ (6.8) 
Portanto, usando esse resultado em 6.7, 
Ly = í=Lj=— eixo (6.9) 
= -%- ee? 0 


| 

| 
8 
E 

| 
m 
— 
8 


6.0.1 Critério de estabilidade de Routh-Hurwitz 
O critério de Routh-Hurwitz permite verificar se todas as raízes de um polinô- 
mio característico (ou os polos de uma função de transferência) 

A(s) = aos” +. ays" 14+... tan_1s+a+n (6.12) 


com a; > 0, Vi = 0,...,n estão no semiplano esquerdo sem resolver a equação 
A(s) = 0, bastando examinar uma tabela construída de modo sistemático. 
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Mais especificamente, basta verificar se não há troca de sinais na primeira 


coluna de 
S ao 42 Q4 te QAn—4 An-2 n 
gl 4 aq a3 as cc as 1 O 
s72 4 by b2 by + br bn 
s73 ci C2 CG coo ex 
ES (6.13) 
3 
S Pı P2 P3 
2 
S q 42 
s! ri 
s? S1 
em que 
— a1a2—a9a3 — Mas—agas .., 
bi = bo = = (6.14) 
— byag—aho — bias—aibgs 
Ci = by C2 = bi (6.15) 
e assim por diante. (6.16) 


Este critério é conhecido como o de Routh-Hurwitz e demonstrações rigorosas 
do critério de Routh-Hurwitz podem ser encontradas em (SCHWARZ; FRI- 
EDLAND, 1965), (CHAPELLAT; MANSUR; BHATTACHARYYA, 1990). 


Uma demonstração simples é apresentada no Apêndice D. 


6.0.2 Exemplo 


Seja um processo cuja relação entrada-saída é dada, no domínio transformado, 


por 
K 


T(s) = 

(s) s4+ 253+ 68s? + 4s + K 
Para determinar para quais os valores K o sistema é estável, deve-se verificar 
quando o polinômio A(s) = s* + 2s? + 6s? + 4s + K = 0 tem todas as raízes 
no semiplano esquerdo (SPE), montando-se o arranjo de Routh-Hurwitz 


(6.17) 


s1 1 6 K 

3° 2 4 

s2 4 = 2x6 1x4 K = Eb (6.18) 
1 1 | 4x4-2xK 

s 4-3K = Z 

3? K 


Logo, o processo é estável se 0 < K <8. 
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6.0.3 Critério de Kharitonov 


Este resultado é útil quando os coeficientes do polinômio característico A(s) 
possui incertezas. 
Considere, então, uma família de polinômios característicos de grau n 
a Ear 

A[{ao, 02... +, {a1, a3,...}](s) = aos” + as"! + aos"? +...+an (6.19) 

em que cada coeficiente a; pode assumir valores constantes entre ami" e qmax 
0 < a™™ < a; < a (6.20) 

para i=1,..,n. 
Sejam ainda os conjuntos de coeficientes organizados como a seguir 


max „min „max „min 


P= {aj » 49 » 04 » 26 a (6.21) 
P= (api, i a gmax, a (6.22) 
I= fa, a gmin, ah (6.23) 
ielo ay a a a) (6.24) 


Critério de Kharitonov Todos os polinômios Al(ao, a2,...k, (a1,as,...H(s) serão 
Hurwitz se os seguintes quatro polinômios forem Hurwitz 


AIP, 1](s), A[P, 1](s), A[P, 1](s), ALP, 1](s) (6.25) 


A prova desse resultado pode ser encontrado no artigo original de (KHARI- 
TONOV, 1978), ou em (YEUNG; WANG, 1987). 


6.0.4 Exemplo 


Suponha que, em vista de incertezas nos valores dos componentes utilizados, 
tem-se que 


A(s) = (1+0.05)s! + (2+0.2)s? + (640.3)s? + (4+0.1)s + (5+0.4) (6.26) 


ou seja, 
ao € (0.95, 1.05] (6.27) 
a € [1.8,2.2] (6.28) 
ao € [5.7,6.3] (6.29) 
ag € [3.9,4.1] (6.30) 
aq € [4.6,5.4] (6.31) 
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Nesse caso, as raízes de A(s) = 0 estarão todos no semiplano esquerdo se todos 
os polinômios 


P = 1.05s?+5.7s+5.4 (6.32) 
P = 0.95s? + 6.38 + 4.6 (6.33) 
T = 228439 (6.34) 
I = 1.8s+4.1 (6.35) 

(6.36) 


forem Hurwitz. 


6.0.5 Caso de tempo discreto 


O modelo é estável se os autovalores (Raízes de A(z) = det(zI — A) = 0) 
estiverem no círculo unitário (Re[z]? + Im[z]? < 1), já que |A(A)| < 1 => 
AP > 0,k > oo. 


Existem testes andlogos ao de Routh-Hurwitz no caso continuo, porém signi- 
ficativamente mais trabalhosos de aplicar, por exemplo: 


1. Jury, E. I. Inners and stability of dynamic system. Wiley, 1974. 


2. Liénard, A. e Chipart, M. H. Sobre o sinal da parte real das raizes de 
uma equação algébrica (em francés). J. Math. Pures Appl, v.10, n.6, 
1914, pp. 291-346. 


Outra possibilidade é utilizar a transformação 
z—1 


= 6.37 
we T] (6.37) 


para mapear o círculo unitário para o semiplano esquerdo (SPE) e utilizar o 
critério de Routh-Hurwitz. 


6.0.6 Exemplo 


Considere o problema de determinar o valor de ganhos K de modo que o 
processo do diagrama de blocos da figura 6.1 seja estável. 


R Yı 
(z) : ? x] (z) 


Figura 6.1: Estudo da estabilidade em função do ganho K. 
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em que 
z 
G(z) = = 
(2) z2 + 0.7z + 0.1 
Fazendo-se a substituição 
1l+w 
= 6.38 
É l-w 
obtém-se no plano W que 
= 5K(1— w? 
G(w) = dew) (6.39) 


(2—5K)w?+9w+5KkK +9 


Utilizando-se o critério de Routh-Hurwitz, obtém-se que ha estabilidade se 
—1.8 < K < 0.4. 


6.0.7 Critério de Nyquist 


O critério de Nyquist é muito utilizado por permitir interpretação gráfica di- 
reta, por levar a definições importantes como a margem de fase e margem de 
ganho, bem como pela possibilidade de extensão ao caso multivariável. 


Seja Ga(s) uma função de transferência em malha aberta com P polos no se- 
miplano direito e I o contorno de Nyquist, a ser percorrido por s no sentido 
horário ©. 


Nessas condições e de acordo com o critério de Nyquist, o número de polos 


da função de transferência de malha fechada G p(s) = ot. resultante da 
realimentação unitária de Ga(s), é Z, dado por 
Z=N{-1,0|/+P (6.40) 


em que N [-1,0] é o número de enlaçamentos do ponto —1 pela curva A = 
Ga (T). 


Este resultado encontra-se apresentado de modo mais rigoroso no apêndice D. 


Verificação intuitiva do critério de Nyquist 


Considere uma função f(s) mapeando um contorno fechado I que contém P 
polos (se p é polo f(p) > co, p > p) e Z zeros (se z é um zero, f(z) = 0), 
conforme ilustrado na figura 6.2. 

À medida que s percorre o contorno fechado I em que há Z zeros e P polos 
no seu interior, a sua imagem f(T) circunda a origem N = Z — P vezes, em 
que N é contado + se os sentido de percurso forem coincidentes — e no caso 
contrário. 
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Im{f(s)} 


Figura 6.2: Verificação intuitiva do Critério de Nyquist 


Uma vez que a função de transferência de malha fechada Gy é dada por 


G Ga(s) 

— Al 
e) 1+ Gals) San 
a condição a ser testada é se o denominador de 

f(s) = 1+ Gals) (6.42) 


possui zeros no SPE (lembrando que zeros de 1 +Ga(s) são os polos de G'f(s)). 
Na condição representada por 6.40, verifica-se o enlaçamento do ponto —1 e 
tomando f(s) = Ga(s) ao invés de se fazer f(s) = 1 + Ga(s), que, em verdade, 
é uma simples translação de 1. 


Como s tais que 1+Ga(s) = 0 são os polos de malha fechada Gf, Z é associado 
ao polo de malha fechada, enquanto P é associado a polos de Ga, pois, se 
G(s) — oo, então f(s) — oo. 

Como se deseja verificar se há polos de G no SPE, busca-se demarcar o SPD 
usando o contorno de Nyquist, ilustrado na figura 6.3. 


Im{s} G,(s) Im{G,(s)} 


Re{s} Re{G,(s)} 
á N antoi 
de Nyquist 


Figura 6.3: Mapeamento do contorno de Nyquist pela função de transferência 
de malha aberta Ga(s), ilustrando os enlaces do ponto crítico (—1, 0). 
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No exemplo da figura 6.3, P = 1 (há um polo de malha aberta no SPD) 
e a imagem Ga(T) está circundando o ponto crítico —1 uma vez no sentido 
concordante àquele do percurso do contorno de Nyquist. 

Logo, N[-1,0] = 1. 


Tem-se, portanto, 


N = Z-P (6.43) 
1 = Z-1 (6.44) 


e, conclui-se que Z (numero de polos de malha fechada) é 2 (ou, instável para 
ganhos K pequenos em KGa(s)). 


Por outro lado, se o ganho de malha (K) for aumentado, o ponto —1 será 
circundado 1 vez no sentido anti-horário, caso em que 


N = =P (6.45) 
Es Beh (6.46) 


resultando em Z = 0. (Fazendo-se uso das regras do método lugar geométrico 
das raízes, nota-se que, à medida de K aumenta, os zeros que estão no SPE 
atraem os ramos). 


Caso a função de transferência de malha aberta possua polos imaginários pu- 
ros ou polo na origem, o contorno deve ser acrescido de desvios infinitesimais, 
pois o contorno T não deve passar por singularidades. 


Um método para o traçado da curva de Nyquist é esboçar antes as curvas 
de Bode, embora muitos prefiram um procedimento direto a partir das con- 
figurações de polos e zeros do processo. Além disso, é recomendável também 
verificar se o critério de estabilidade baseado na curva de Nyquist está compa- 
tível com o LGR (ou seja, o número de polos no semiplano direito informado 
pelo LGR é o mesmo daquele determinado pelo critério de Nyquist). 


A seguir são apresentados alguns casos didáticos de aplicação do critério de 
Nyquist. 


Exemplo - Caso simples de primeira ordem 


A função de transferência, nesse caso, é da forma 


G(s) = K- - - (6.47) 


e, portanto, considerando s = jw, um ramo começa para w = 0 no ponto 1 e 
tende para a origem à medida que w — oo, aproximando com ângulo de —90° 
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(intuitivamente JM = —je, se M for muito grande, já que jM +a ~ jM). 
Note-se que, para qualquer valor de K > 0, a imagem do contorno de Nyquist 


não enlaça o ponto crítico —1, sendo, portanto, estável. 


log(«) 


Im[GGo)] 


Ponto 
Critico 


Figura 6.4: Curva de Nyquist correspondendo a um sistema de primeira ordem. 


Exemplo - Polo na origem 


Se a função de transferência possui um polo na origem s = 0, então o contorno 
de Nyquist deve incluir um pequeno desvio de modo que não inclua singula- 
ridades, já que na apresentação formal que utiliza o teorema de Cauchy não 
deve haver singularidades no contorno. 


O contorno adaptado pode ser visto à esquerda da figura 6.5. No exemplo, a 
função de transferência é 


1 
G(s) = K ——______~ 6.48 
(s) s(s+1)(s +2) oe) 
e, portanto, se s = jw = je, entao G(jw) tem como seu denominador, 


je(je + 1)(je + 2) = je. 

Ou seja, |G(jw)| = —jM com M “muito grande”. 

Na figura à direita de 6.5, esse fato é representado pelo início do ramo no ponto 
A. 


Para w > co tem-se que |G(jw)| — 0 aproximando-se da origem pelo ângulo 


de —270º, correspondendo a E 


Note-se que se o ganho K for aumentado, vai haver, eventualmente, o enlaça- 
mento do ponto crítico —1, significando que a partir de um certo valor de K 
o sistema será instável. 
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Re[G(jo)] 


4 
2’ Contomo 
- 
Ct-7 de Nyquist 


Figura 6.5: Curva de Nyquist correspondendo a um sistema de terceira ordem 
com um polo na origem. 


Exemplo - Polo no semiplano direito 
Considere o processo cuja função de transferência é 


G(s) = K- a (6.49) 


que possui um polo no SPD em malha fechada para ganhos K pequenos. 


Im[s] 


G() Im[G(jo)] 
S —_ 


N Ponto 
\ Critico 


Re[s] 


B=c Re[Go)] 


4 
_2*Contomo 
de Nyquist 


Figura 6.6: Curva de Nyquist correspondendo a um sistema com um polo no 
SPD. 


Exemplo - Polos imaginários puros 


Como o contorno de Nyquist não deve conter singularidades, é necessário que 
sejam introduzidos desvios em torno dos polos imaginários puros, conforme 
visto à esquerda da figura 6.7. 


Uma das características desse tipo de sistema é que a imagem do contorno de 
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Nyquist pode apresentar assíntotas com ângulos diferentes de k 90º, como é o 
caso na 6.7. 

As letras 4, B, C e D indicam a associação entre os pontos notáveis no 
plano s e no plano G(jw) Nota-se na figura 6.7 que o contorno de Nyquist foi 


Re[G(jo)] 


7 
> -° Contorno 
de Nyquist 


Figura 6.7: Curva de Nyquist correspondendo a um sistema que possui um 
par de polos no eixo imaginário. 


modificado de modo a não conter singularidades. 


Exemplo - Polo duplo na origem 


Como visto anteriormente, quando se percorre k vezes um contorno T ao redor 
de p polos, a sua imagem através de G(jw), às vezes denotado G(T), percorre 
a origem de kp vezes (no sentido contrário). 


Portanto, ao se percorrer o desvio com a forma de semicírculo (180º) em torno 
do polo duplo na origem, verifica-se que a sua imagem deve descrever 360º. 
Tal situação é ilustrada na figura 6.8, em que o semicirculo D — A é mapeado 
no círculo D > A. 


6.0.8 Margens de fase e de ganho 


Considerando-se a conveniência de trabalhar com a resposta em frequência, 
pode-se invocar o critério de Nyquist para incorporar especificações de robustez 
quanto à perda de estabilidade, expresso por dois indicadores: margem de fase 
e margem de ganho. 

Margem de ganho: é o inverso da magnitude do número complexo G ma (jwo) 
quando wo é tal que £G (jwo) = — 180º. 

A margem de ganho representa o ganho adicional que ainda mantém o sistema 
estável, quando a malha for fechada com realimentação unitária. 


Margem de fase: é a quantidade de atraso de fase que pode ser introduzido na 
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Im[s] 


Polo Duplo 
na Origem 


Re[G(jo)] 


4 
»“Contomo 
de Nyquist 


Figura 6.8: Curva de Nyquist correspondendo a um sistema que possui polo 
na origem de multiplicidade 2. 


situação IG MA ( jwo)| = 1, de modo que o sistema continua estável, quando a 
malha for fechada com realimentação unitária. 


As margens de ganho e de fase podem ser obtidas graficamente das curvas de 
Nyquist, Bode e na carta de Nichols, como visto na figura 6.9. 


Nyquist Bode 


|G| dB v 
; o 


yo 


Figura 6.9: Leitura direta das margens de ganho e de fase das curvas de 
Nyquist, Bode e da carta de Nichols. 


No caso de um sistema de segunda ordem caracterizado por (£, wn), a condição 
(Gma (jwo)| = 1 ocorre para 


wo = ony yl + 4€4 — 2¢2 (6.50) 


e a margem de fase y é dada por 


1 26 
vI 4 — 26? 


y= tan” 


(6.51) 
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Uma aproximação útil para y (em graus) que vale para € pequeno é 


y= 100 x € (6.52) 


6.1 BIBO - Estabilidade 


Por simplicidade, admite-se aqui que o sistema é SISO (Single Input, Single 
Output), ou seja, Célxmne Bénx1, na equação de estados 


x = Ax+Bu (6.53) 
y = Cx (6.54) 


Como visto anteriormente, a solução do sistema de equações diferenciais 6.54, 
para a condição x(0) = 0, é dada por 


y(t) = CeA*'x(0) + J ' CeAt-Bu(r)dr (6.55) 
0 


No caso de ser ter uma entrada nao nula mas limitada, ou seja, 


|u(t)| < Umax < 00 (6.56) 
tem-se que 
t 
y(t) = Í CeAt-7)Bu(r)dr (6.57) 
0 
Em cada instante de tempo t, nota-se que 
t 
ly(t)| = | CeA) Bu(r)dr (6.58) 
0 
t 
< | CA Bu(r)| dr (6.59) 
0 
t 
< f Cet- BU max| dr (6.60) 
0 
t 
< J CMB dt Umax (6.61) 
0 
e, portanto, se 
t 
/ lceAe)B| dr <M; t>0 (6.62) 
0 


a saida y sera limitada 


|y(t)| < M Umax < co; Vt>0 (6.63) 
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Diz-se, nesse caso, que o sistema é BIBO estável (Bounded Input Bounded 
Output). 

Lembrando que a resposta impulso é dada por y(t) = Ce“*B, depreende-se 
de 6.62 que o sistema é BIBO estável se a resposta impulso é limitada, o que 
acontece se todos os autovalores de A estiverem no semiplano esquerdo. 


A pertinência dos polos da função de transferência (ou os autovalores da 
matriz de sistema A) ao SPE é critério de estabilidade apenas para modelos 
LTI. 


Se o sistema é linear mas variante no tempo (ou seja, não autônomo), esse 
critério não é aplicável. Embora seja simples obter através de métodos 
numéricos as raízes de um polinômio cujos coeficientes são numéricos, tal 
não acontece quando estes são literais. 


Os métodos baseados em resposta em frequência (curvas de Bode, critério 


de Nyquist e cartas de Nichols) permitem a determinação das margens de 
ganho e de fase que se relacionam com o “grau” de estabilidade. 


6.2 Algumas personalidades ilustres 


1868 James Clerk Maxwell FRSE FRS (1831 Edimburgo-1879 Cambridge) 
apresenta o primeiro artigo com uma análise matemática rigorosa de um sis- 
tema de controle realimentado. 


1877 Ivan Alekseevich Vyshnegradsky (1831-1895) publicou “O regulyatorakh 
pryamogo deystiva” (“On Direct-Action Regulators”), envolvendo condições de 
estabilidade para uma máquina a vapor com regulador centrífugo. A sua aná- 
lise da estabilidade de reguladores utiliza enfoque de equações diferenciais e 
foi realizada independentemente de J. C. Maxwell. 


1877 Edward John Routh (1831-1907) recebeu o Prémio Adams pelo seu tra- 
balho A treatise on the stability of a given state of motion, particularly steady 
motion, editado pela McMillan, London. Routh foi Senior Wrangler no Mathe- 
matical Tripos em que Maxwell ficou em segundo lugar. Routh orientou cerca 
de 700 alunos, dos quais 480 foram Wranglers dentre os 900 Wranglers dos 30 
anos de sua carreira. 


1895 Adolf Hurwitz (1859-1919) publica a obra Uber die Bedingungen, un- 
ter welchen eine Gleichung nur Wurzeln mit negativen reellen Theilen besitzt. 
Mathematische Annalen, v. 46, 1895, pp. 273-284. 


1922 Nikolai Fyodorovich Minorsky (1885-1970) introduz o controlador de trés 
termos, mais tarde popularizados como controladores PID. Resultados sobre 
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controle não linear estão contidos em Introduction to non-linear mechanics: 
Topological methods, analytical methods, non-linear resonance, relaxation os- 
cillations, J.W. Edwards, 1947. 


Aurel Boleslaw Stodola (1859-1942) estudou o problema de regulação de tur- 
binas de água em Stodola, A. B. Ueber die Regulierung von Turbinen. Schwei- 
zerische Bauzeitung, v. 2, n. 17, 1893, pp. 113-117. 

1932 Harry Nyquist (1889-1976) propõe a teoria da regeneração e apresenta o 
critério de estabilidade de Nyquist. Os conceitos de margem de fase de ganho 
decorrem desse critério de estabilidade. 


Stodola Nyquist Routh Hurwitz Vyshnegradskii Minorsky 


6.3 Exercícios 


6.3.1 Exercício: Critério de Routh-Hurwitz 


Estudar o comportamento quanto à estabilidade, em função do parâmetro 
K e (0,00): 


1. 
G (s) = oS (6.64) 
2. 
(s+D)(s+v3 
G(s) = KT ~ o (6.65) 
É (s +1) (s +2) 
G(s) = Ka (6.66) 
4. 
Gus KSA (6.67) 
5. 
Ks 


(6.68) 
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i cae Kk 
7 
co 
8. 
a = WEES 
9. 
SUIS KD 


10. 


Gg) = nto 
11. ai 
Ge) Kee . 
12. 
ele a Pi 
13. 
Gar“ au 
14. 
CESR g Pree: 10) 
15. 
Ge ket 
16. 
G(s) = xt 8) +40) 


53 (s + 100) (s + 200) 


(6.69) 


(6.70) 


(6.71) 


(6.72) 


(6.73) 


(6.74) 


(6.75) 


(6.76) 


(6.77) 


(6.78) 


(6.79) 
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17. 
ü pr (s? +28 +5) Edo 
DC RR e) 
18. 
K (s +1) (6.81) 
s3 (s + 6)? l 
19. 
E E (6.82) 
(s +1) (0.25 + 1) l 
20. 
2 
Cie AG (6.83) 
21. 
G(s) = KQ-s) _ (6.84) 
(s+ 1)(s+ 2) 
22. 
ey KCER (6.85) 
s (s3 + 3s? + 12s — 16) l 
23. 
pon God (6.86) 
24. 
de= 8) gous 
OL array (6.87) 


6.3.2 Exercício: Polinômios de Hurwitz 


Determinar os valores de K para que as equações possuam raízes com a parte 
real negativa 


a) 
st +s? +38? +2s+K=0 (6.88) 

b) 
s°+(5+K)s?+7s+18+9K =0 (6.89) 

c) 


$ +3K? +(K+2)s+4=0 (6.90) 
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6.3.3 Exercício: Sistema realimentado PD 


Considere um sistema descrito pela equação diferencial ordinária 


dy „y „dy 
qo tda tia =u (6.91) 


a ser controlado segundo 


dy 
dt 


u = -Kpy-Kp (6.92) 


Usando o critério de Routh-Hurwitz, indicar graficamente a região Q C R? de 
modo que o sistema realimentado seja estável para (Kp, Kr) € Q. Observa- 
ção: Esse sistema se refere a uma estrutura de controle de uma planta com 
realimentação tacométrica) 


6.3.4 Exercício: Estudo de estabilidade 


Verificar se a função de transferência em malha aberta dada em 6.93 é estável, 
em malha fechada com realimentação unitária, para algum valor de K € Re 
NEZ. 


Cask tils +8) (6.93) 


sty. [(s +k)? + k?] 


6.3.5 Exercício: Estabilidade em malha fechada 


Determinar quais são os valores do ganho K > 0 tais que o processo descrito 
por G(s) seja estável quando operado em malha fechada com ganho unitário 
na realimentação: 


(a) 


Y(s) _ K 
R(s) s8+Ks2+2Ks+K (6.94) 
(b) 
Y (s) _ 5(1—s) 
R(s) s4+2s84+ Ks?+4Ks—5K (6.95) 
(c) 
(s? + 2s + 5) 
ea (6.96) 


s(s+4)(s+5)(s+1) 
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6.3.6 Exercício: Critério de Nyquist 
Assumindo que o sistema será operado em malha fechada com realimentação 
unitária (H(s) = 1), analisar a estabilidade utilizando o critério de Nyquist: 


1. 
= K(s— 1) 


2. K( 2) 
s+ 
Gl) = By ae +10 Oe) 
3. p 
GE (s + 2) (s? + 4) ea 
4. K(s +2) 
s+ 
=o" 1 
G(s) eat) (6.100) 
5. SE 
s+ 
G(s) = ———, 6.101 
(s) 53 (s +4) l i 
: K(s+1) 
s 
= .102 
Gly) s2 (s + 2) (s2 +4) (eog) 
7. K(s241) 
sê + 
= .1 
ot) s(s+1)(s+ 2) (6108) 
6.3.7 Exercício: Critério de Kharitonov 
Considere a família de modelos descritos por 
A(s) = 5 tas! + ags? + ags? + ags + as (6.104) 


Verificar se todos os membros dessa familia de modelos incertos são estáveis: 
1. A(s) = 8 + aist + ags? + azs? + ays + as em que 
a = [t;11] (6.105) 

a2 8; 8] (6.106) 

az = (24; 24] (6.107) 
(6.108) 

(6.109) 

(6.110) 


a4 = [32; 32] 
as = [20; 20] 
as = [4]; 4] 
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6.3.8 Exercício: Critério de Kharitonov 


Considere a família de modelos descritos por 
A(s) = $ + a18? + a258 + a3 (6.111) 


Qual o maior valor da incerteza a admissível para que essa família de modelos 
permaneça estável? 


a = 6 (6.112) 
a = 11 (6.113) 
az = 6+a (6.114) 

(6.115) 


6.3.9 Exercicio: Margens de Fase e de Ganho 


Determinar os valores das margens de ganho e de fase: 


1. 
Ce Ne ie : Ds +3) 
2. j 
A) = rara 
e s+3 


G(s) = 


ERESIA EES 


6.3.10 Exercício: Estabilidade de sistema com atraso 


Considere um sistema com atraso de transporte descrito por 


G(s) = (6.116) 


s+1 


Qual é o máximo valor admissível para T de modo que o sistema, ao ser 
realimentado unitariamente, ainda seja estável? 


7 


Métodos de Lyapunov 


“Tt is a truth universally acknowledged that stability requires far more 
effort to restore than to disrupt..” 
— Simon Spurrier 


Esta seção busca apresentar duas classes de métodos para análise da estabili- 
dade proposta por Alexandr Mikhailovich Lyapunov, cujo trabalho foi publi- 
cado em 1892 e possui diversas traduções (LYAPUNOV, 1992). 


Aqui serão tratados apenas os casos de sistemas de tempo contínuo, embora 
existam adaptações para os casos de tempo discreto. 


Os métodos de Lyapunov permitem a investigação da estabilidade de sistemas 
não lineares não autônomos (invariantes no tempo) ou não. 


Em particular, sistemas lineares não autônomos são também tratáveis pelos 
métodos de Lyapunov, o que não é possível com métodos baseados na locali- 
zação dos polos. 


Os métodos de Lyapunov são também úteis para mitigar os problemas de in- 
certezas na modelagem, mesmo quando o processo controlado é modelado por 
sistemas LTI, como o caso da utilização de controle adaptativo. 


Um aspecto teórico interessante, nesse enfoque, é a validade do método de 
aproximação utilizando a expansão em série de Taylor de f(x,u) para o es- 
tudo da estabilidade, bem como para o projeto de controladores. 


7.1 Primeiro método de Lyapunov 


O primeiro método de Lyapunov, também conhecido como o método indireto 
ou método da linearização, permite investigar a estabilidade local de um sis- 
tema não linear através do seu modelo linearizado obtido pelo truncamento 
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da expansão em série de Taylor. 


Como visto anteriormente, sob adequadas condições sobre f de x = f(x), o te- 
orema de Hartman-Grobman garante que algumas conclusões obtidas usando 
o modelo linearizado pode ser transferido para o modelo não linear original. 


Trata-se de um resultado de grande relevância prática, pois serve de base para 
projetos de controladores, utilizando modelos linearizados em torno do ponto 
de operação nominal. 


Considere um sistema do tipo 


x = few (7.1) 
f{(xz,uz) = 0 (7.2) 


em que ug é uma função constante, ou seja, um sistema com ponto de equili- 
brio em (xg, Ug). 

O modelo linearizado em torno deste ponto de equilíbrio (xg, up), em termos 
de perturbações Ax e Au, é dado por 


of 


= Ax + — 


Ax = Auto(IAx|,|Aul) (7.3) 


Gi (xE UE) 


(xp;up) 
— 


A B 


conforme visto anteriormente, fazendo-se u = ug + Aue x = Xp + Ax. 


Tendo-se obtido o modelo linearizado do sistema representado por 7.1 em torno 
do ponto de equilíbrio (xp, ug), 


1. Se o modelo linearizado 7.3 é assintoticamente estável (os autovalores de 
A estão no interior do semiplano esquerdo), então o sistema original 7.1 
é assintoticamente estável na vizinhança de (xg, ug). 


2. Se o modelo linearizado 7.3 é instável (os autovalores de A estão no 
interior do semiplano direito), então o sistema original 7.1 é instável na 
vizinhança de (xg, uz). 


3. Se algum autovalor de A está localizado sobre o eixo imaginário, nada se 
pode afirmar sobre a estabilidade do sistema original 7.1 usando esse mé- 
todo. Nesse caso, pode-se tentar utilizar o conceito de variedade central 
(vide, por exemplo, (KHALIL, 1992) ou (SAASTRY, 1999)). 


A prova do primeiro método de Lyapunov é um corolário imediato do 
teorema de Hartman-Grobman (ver, por exemplo, (KREYSZIG, 1978), (AR- 
NOLD, 1973), (BALAKRISHNAN, 1981)). 
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Exemplo: Pêndulo simples 


Seja um pêndulo com haste rígida, massa m e comprimento L, sob efeito de 
aceleração de gravidade g, uniforme na direção vertical, ilustrado na figura 
7.1 e descrito, na ausência de atrito, pelo sistema de equações diferenciais não 
lineares 


Ly = T2 
t2 = ` sin (21) 
Os pontos de equilíbrio são da forma (k7,0), k = 


0,1,2,...e a matriz A indicado em 7.3 é dada por = 


E 0 1 
EE | —4 cos (zı) 0 | (7.6) 


Em torno de xg = (0,0) tem-se que os autovalo- 
res sao 


Figura 7.1: Um pêndulo 
simples de haste rigida. 


Logo os autovalores são A = +7 Vt e a parte real 

é nula (não hiperbólica). 

Portanto, o primeiro método de Lyapunov não permite garantir a estabilidade 
do sistema original. 


Em torno do outro ponto de equilíbrio (correspondendo ao pêndulo invertido), 
Xp = (7,0), tem-se que 


a- | -2-0="=: (7.8) 


z 0 


al 
i 
oe 


e, portanto, há um autovalor no semiplano direito e, de fato, o ponto de 
equilíbrio (7,0) é instável (pêndulo invertido). 
7.2 Segundo método de Lyapunov 


O segundo método de Lyapunov, também conhecido como o Método Direto, 
é baseado em um conceito análogo ao de “energia”. 
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Exemplo preliminar 


Considere, para efeito de ilustração preliminar, o mesmo pêndulo visto ante- 
riormente, mas agora com um coeficiente de atrito viscoso b > 0, 


2 
mis + no + mgsin O = 0 (7.9) 


em que O é o ângulo entre a haste do pêndulo e a vertical. 


As energias cinética e potencial são dadas, respectivamente, por 


2 
Fa de 
E, = mgh (7.11) 
= mgL(1 — cos6) (7:12) 


A energia total é a soma das energias potencial e cinética, 
Er = Ee + E, (7.13) 


e se verifica por cálculos simples que a sua variação no tempo é 


2 
dEr do 

= a ; 

mM (5) b<0 (7.14) 
e, se o atrito é nulo, 
2 
do do 

== = — = .1 

(2) b=0 => a 0 (7.15) 


: A de 
Portanto, a energia do pêndulo decresce sempre que 4 #4 0, tendendo a Er 
mínimo que, no caso ocorre para (0, æ) = (0,0), e também dir = 


Pode-se verificar, utilizando o 1° método, que os autovalores estarão localiza- 
dos no semiplano esquerdo, se b > 0 


7.2.1 Funções positivo definidas 


Para que se apresente o Segundo Método de Lyapunov de modo mais rigoroso, 
são necessárias algumas definições sobre propriedades das funções que serão 
utilizadas para realizar a analogia com a expressão de energia (embora não seja 
sempre adequado fazer tal associação, por exemplo, em sistemas econômicos 
e populacionais). 


Métodos de Lyapunov 197 


e Uma função V : R” > R é dita ser positivo definida em uma vizinhança 
B(0, p) da origem com raio p se Vx € B(0, p), V(x) > 0 e V(x) = 0 => 
x = 0. 


e Uma função V : R” > R é dita ser positivo semidefinida em uma vizi- 
nhança B(0, p) da origem com raio p se Vx € B(0,p), V(x) > 0 mas 
V(x) =0%x=0. 


e Uma função V : R” — R é dita ser globalmente positivo definida se é 
positivo definida em B(0, p) com p Î co. 


e Uma função V : R” > R é dita ser negativo definida em uma vizinhança 
B(0, p) da origem com raio p se —V é positivo definida. 


em que a ou vizinhança (ou bola) de raio p em torno de um ponto x é carac- 
terizado formalmente por B(x, p) = {z € R” | |z —x|| < p}. 


Uma das escolhas mais populares para V na utilização do critério de Lyapunov 
é a forma quadrática 


V(x) = x] Qx (7.16) 
em que Qnxn é uma matriz simétrica. 
Se essa expressão resultar em uma função V positivo definida, então Q é dita 
ser positivo definida e denotada Q > 0. 
Um teste útil para verificar a positividade de uma matriz é que todos os 
menores principais de Q sejam positivos (critériolde Sylvester) 


q1>0 (7.17) 
qm 2 LQ (7.18) 
q2 q22 


q1 12 %13 
m2 922 923 | > 0 (7.19) 
q3 923 033 


Outras definições podem ser obtidas combinando os qualificativos positivo, 
negativo, globalmente e prefixo semi, por exemplo, a matriz Q é globalmente 
negativo definida 


Q= | E 4 | (7.20) 


uma vez que x"Qx = —(x7 + #3) < 0 para Vx € R? — {0}. 
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A notação M > O é usada para indicar que uma matriz M € R”*” é positivo 
definida, ao invés de M > 0, uma vez que R”*” é apenas parcialmente orde- 
nado, diferentemente de x? Mx € R. 


A notação M > N é usada para indicar que M — N > 0. 


7.2.2 Caso de sistemas autônomos (invariantes no tempo) 


Considere um sistema de ordem n (ou seja, x(t) € R”), descrito pela EDO 


x = f(x) (7.21) 
f(0) =0 (7.22) 


Não ha perda de generalidade em assumir f(0) = O porque é possível reali- 
zar uma translação dos eixos do sistema de coordenadas obtendo-se a função 
f(x) = f(x + xg) com a propriedade que f(0) = f (xp) = 0. 


Segundo método de Lyapunov 

A origem do sistema representado por 7.22 é 
estável em uma vizinhança B(0, p), se existe 
uma função continua V : R” > R tal que 


e V é positivo definida em B(O, p) (so 
e contínua em relação a t LAS 


° ae) = V,x é negativo semidefinida 


em B(0, p) 


Vo)-=cte 


Figura 7.2: Relação entre a 
curva de nível de V e as vizi- 
nhanças envolvidas na prova do 
Por definição, um ponto de equilíbrio O é es- 2º método de Lyapunov. 

tável se dado € > 0 arbitrário, dó(=) > 0 tal 

que x(to) E€ B(0,0) = x(t) € B(0,€). 

Assuma que é dado um € > 0 e seja 0B(0, €) 

a fronteira de B(0,€), como ilustrada na figura 7.2. 


Esboço da prova 


Seja Vmin O mínimo de V(x) para x € B(0, £) e note que V(x) < Vmin > X € 
B(0,.). 

Seja ô tal que Vx € B(0,0), V(x) < Vmin. Se x(to) € B(0,6), então 
V(x(t)) < Vmin para t > to, pois aV (x(t) < 0 e V(x(to)) < V(x(t)) para 
t > to. 

Portanto x(t) € B(0, £), Vt > to. 
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Observações 


e Uma função V que satisfaz as condições (i) a (iii) é chamada de função 
de Lyapunov. 


e Se na condição em 7.2.2 a função V(x(t)) é negativo definida em B(O, p), 
então a estabilidade é assintótica. Às vezes, quando V(x(t)) é apenas 
semidefinida, o resultado pode ser aprimorado mediante o uso do lema 
de Barbalat, Apêndice F. 


e Se a função V é radialmente ilimitada (radially unbounded), ou seja, se 
V(x) > oo para x > ov, então a origem é globalmente estável. 


e Situações em que V(x) = 0 em uma certa região podem, às vezes, serem 
tratadas pelo princípio de La Salle (vide, por exemplo, (SLOTINE; LI, 
1991), (KHALIL, 1992)). 


Exemplo: Sistema unidimensional 


Considere o sistema unidimensional (x € R) 

t = —o(x) (7.23) 
em que a função o : R > R é tal que €o(€) > 0, VE # 0 
Utilizando como a função candidata de Lyapunov, 

V(x) = 2? (7.24) 
que é positivo definida, obtém-se que 


dV (a(t) dx 
E ae 
= —2x(t)c(x(t)) <0 (7.26) 


ou seja, o sistema é assintoticamente estável. 


Exemplo: Sistema massa + mola não linear + amortecedor não linear 


Considere o modelo de sistema massa + mola + amortecedor e, ao invés de 
uma característica linear da mola, seja fm = kx e do amortecedor fa = bz, 
em que ambas são funções não necessariamente lineares 


fm = g(x) (7.27) 
fa = dg) (7.28) 
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tais que h e g são contínuas, h(0) = 0, g(0) = 0, z h(x) > 0 e zg(x) > 0. 
O movimento da massa é descrito por 


#+ h(z) + g(x) = 0 (7.29) 


Usando a notação xı = x e x2 = t, obtém-se a representação no espaço de 
estados 


Ly = T2 (7.30) 
xo = —g(x1) — h (x2) (7.31) 


Lembrando que a expressão da energia total (cinética+potencial) pode ser 
usada como a função candidata de Lyapunov, seja 


V (21,22) = 523 + [ o (7.32) 


Pode-se verificar que V assim definida é positivo definida e, também, constata- 
se que (0,0) é ponto de equilíbrio. 
Aplicando-se o segundo método de Lyapunov, tem-se que 


V = voto + g(a1)21 (7.33) 
= vo (>g(x1) — h(x2)) + g(x1) (x2) (7.34) 
= —zə2h (x2) (7.35) 


que é negativo semidefinida. 


A expressão 7.35 indica que V (æ1(t), x2(t)) diminui, sempre que componente 
z2 não for nulo, ou seja, o amortecedor está dissipando energia para o meio 
ambiente. 


Exemplo: Utilização do primeiro e segundo métodos de Lyapunov 


a = -r-r (7.36) 


T = t14— r3 7.37) 
O ponto (0,0) é de equilíbrio e o problema é verificar se este é estável. 


Pelo primeiro método de Lyapunov, tem-se que o modelo linearizado é 


2 o 2 3 2 
Ae = | pi o Ax (7.38) 
1 J (@1,22)=(0,0) 
= E NES (7.39) 
w 
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Os autovalores de A são obtidos de det(AI — A) = 0 ou seja, A = 0 multipli- 
cidade 2. 


Como os autovalores de A estão sobre o eixo imaginário no plano s, nada se 
pode afirmar sobre a estabilidade do ponto (0,0) baseado no primeiro método 
de Lyapunov. 


Porém, a expressão 7.39 pode ser reescrita como 


Ar, = 0 (7.40) 
Ar. = Agi (7.41) 


e, se a condição inicial for (Axı(0), Ax2(0)) = (1,0), resulta de 7.40 que 
Ax; = 1 para Vt > 0. 
Logo, de 7.41, tem-se que 

Agelt)=t (7.42) 
que tende a oo à medida que t > oo. 
Em outras palavras, usando o modelo linearizado, concluir-se-ia (esquecendo 
que há um autovalor em cima do eixo imaginário) que a origem é instável. 
Porém, pelo segundo método de Lyapunov, utilizando as equações de estado 
originais (não lineares) 7.36 e 7.37 e propondo a função candidata 


V (21,22) = 2x2 + 175 (7.43) 
tem-se que 
Vi = 4x8 + 432% (7.44) 
= dip (-2! - 23) + 423 (21 = 23) (7.45) 
= —Agt — 42125 + 42125 — 425 (7.46) 
= -4(2}- 2) (7.47) 


que é negativo definida. 


Logo, o ponto de equilíbrio é, de fato, assintoticamente estável, contrastando 
com o comportamento do modelo linearizado. 


Sistemas não lineares podem apresentar vários pontos de equilíbrio isolados 
um do outro e frases do tipo “o sistema é estável” devem ser reservadas 
apenas para os casos em que todos os seus pontos de equilíbrio são estáveis. 
É conveniente lembrar que é necessário fazer translações de modo que o ponto 
de equilíbrio esteja em O no novo sistema de coordenadas. O insucesso em 
encontrar uma função candidata V não significa que o sistema é instável, pois 
o critério de Lyapunov, se satisfeito, é condição suficiente para a estabilidade 
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7.2.3 Estabilidade de sistemas não autônomos (variantes com o tempo) 


A seleção do instante inicial tọ pode influenciar a resposta de sistemas variantes 
no tempo e, consequentemente, fazem-se necessárias definições adicionais. 
Um ponto de equilíbrio xg é dito ser uniformemente estável se dado ¢ > 0 
arbitrário, Jó(c) > 0 (independente de to) tal que, para qualquer to € R 


Ix(to) — xgl|| < 6 = ||x(t) — xgl| < £, Vt > to (7.48) 


Novamente é possível admitir xg = O 


Uma função V : R” xR? — R é dita ser localmente positivo definida se 
V(0,t) = 0 e 3Vz : R” > R positivo definida, de modo que 


V (x,t) > V(x), Vt > to (7.49) 


Uma função V : R” x R* > R é dita ser decrescente se V(0,t) = 0 e AVy : 
R” > R positivo definida, de modo que 


V(x, t) < V(x), Vt > 0 (7.50) 
Nessas condições, o sistema de ordem n (ou seja, x(t) € R”) 


x = f(x(t),t) (7.51) 
£(0,0) =0 (7.52) 


é uniformemente estável em uma vizinhança B(0, p) se existe uma função 
continua V : R” x Rt > R tal que 


e V é localmente positivo definida em B(0, p) 

e V é decrescente 

e V(x(t)) possui derivadas contínuas em relação a t 
e +V(x(t)) é negativo semidefinida em B(0, p) 


A demonstração no caso de sistemas não autônomos é bastante intricada e 
pode ser encontrada em livros tais como (KHALIL, 1992), (SLOTINE; LI, 
1991), (VIDYASAGAR, 1985) e (SAASTRY, 1999), entre outras obras. 


7.3 Identificação de modelos de tempo contínuo 


O segundo método de Lyapunov pode ser utilizado para identificação de sis- 
temas de tempo contínuo no espaço de estados. 
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7.3.1 Mínimos quadrados de tempo continuo 
Identificação de sistemas estáticos 


Considere o sistema estático linear, escalar (y € R) descrito por 
y(t) = Out) (7.53) 


em que 0 € R é uma constante e t € to, ty]. 


O problema é obter uma estimativa O de 8, minimizando o erro quadratico 


1 ser 


=5/ WO — Ou(t)]? dt (7.54) 


J(0) 


Uma condição necessária para que O seja um ponto estacionário é 


dJ 


@ 


Essa condição se torna, no presente problema, 


dJ d tri 


O — Bly 2 [y(t) — Ou(t)]? dt (7.56) 
_ : - s (u(t) — 20y(t)u(t) + 0u2(0)] dt (7.57) 
z : i [—2y(t)u(t) + 20u2(¢)] dt (7.58) 
= 0 (7.59) 
e a estimativa de O é dada por 
ô = fo Yulo )dr (7.60) 
o u2(r)dr 


Identificação recursiva 


Técnicas de estimação que utilizam todos os dados {u(T),y(T)}+ e [to,t¢] de 
uma vez só são conhecidas como de “batelada”, em contraste as “recursivas” que 
utilizam em cada instante t > 0, os dados {u(T), y(T)}r<t. 


Se o instante presente é t = ty, em vista de 7.60, tem-se que O(t) é dado por 


0 (t) [ u?(r)dt = [runas (7.61) 


to to 
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que derivado em t, leva à EDO que descreve a dinâmica de 6(t) : 


£ (a (t) já Poar) = £ m voutar) (7.62) 
t g 5 
70 (D) = 1 Poar) (—6 (8) u(t) + yOu) (7.63) 


Persistência da excitação 


Se o sinal u(t) for identicamente nulo, tem-se na equação que descreve a dinâ- 


mica de O(t) a situação g, o que não é permitido. 


Logo, a entrada u(t) deve afetar suficientemente o sistema de forma que pos- 
sam ser estabelecidas relações entre as entradas u e as saídas y. 


Uma entrada u com tais características é chamada de persistentemente exci- 
tante. 


Um exemplo de sinal persistentemente excitante é, u(t) = 6(t — to), 
t t 
/ u(r)dr = 6°(r — to)dr = 1 (7.64) 
to to 
e a equação para O(t) se torna 
Aa E 
He (t) = —0 (t) u(t) + y(t)u(t) (7.65) 
Conceito de consisténcia 


O ponto de equilíbrio da equação para 8 é obtido de 


—u?(t)0(t) + y(t)u(t) = 0 (7.66) 
uP (HO) + Ou(t)u(t) = 0 (7.67) 
dt) = 6 (7.68) 


Em vista de @ ser constante, se A(t) é definido como ¢(t) = 6(t) — 0, tem-se 
que 


$26 (7.69) 
e, lembrando que y = Ou, obtém-se uma EDO para q 
RR) (7.70) 
= Bu + yu (7.71) 
= Bu? + Ou (7.72) 
= -ou (7.73) 
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Convergência da estimativa 


Para estudar a estabilidade de d(t) = —qu2, adote a função candidata de 
Lyapunov 
V=¢ (7.74) 
Derivando-se V em relação a t, resulta 
: d 2 
a oF | (7.75) 
= 2ġ¢ (7.76) 
= —2¢7u? (7.77) 


Constata-se pelo lema de Barbalat que (neste caso) (t) > 0, ou 6(t) > 0 
(valor verdadeiro) para t > oo. 


Como 0 converge para o valor verdadeiro 0, diz-se que a identificação (estima- 
ção) é consistente. Mas, em princípio, convergência £ consistência. 


Identificação de sistemas dinâmicos: caso escalar 


Considere um processo com modelo escalar linear, x € R,u € R, |u(t|< M 
para Vt, 

t = ax + bu (7.78) 
em que a < 0 e b são constantes desconhecidas. 
Tanto o estado x quanto a entrada u são assumidos disponíveis (medidos). 


Seja a proposta de dinâmica para a estimativa 


È = G+ bu (7.79) 
e tome-se como meta fazer a(t) > a e b(t) > b, para t > 00. 
Nessas condições, o erro e(t) = x(t) — T(t) satisfaz 
è = (ax +bu) — (a? +bu) (7.80) 


Somando e subtraindo o termo af na equação de e, obtém-se 
é=a(x-#)+(a-@ 2+ (b-b)u (7.81) 
Por conveniência, sejam as variáveis auxiliares 


o(t) = a-a(t) (7.82) 
w(t) = b-t) (7.83) 
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que permite escrever 

é = ae + (t)? + w(t)u (7.84) 
A partir dos sinais conhecidos e(t), Z(t) e u(t), deseja-se obter as leis de adap- 
tação (Fa e Fy): 


à = 6=F,(e,2,u,@) (7.85) 
b = b=F(e,2,u,b) (7.86) 
O sistema de equações descrevendo (e, $, Y) se torna 
é = ae+ot+wu (7.87) 
o = Fale; T, u, @) (7.88) 
b = Fy(e,2,u,b) (7.89) 


Para que o ponto (e, 4,1) = (0,0,0) seja de equilíbrio, F e Fp devem se anular 
para e = 0 (a ser verificado a posteriori). 


Seja a função candidata de Lyapunov 


1 
Vle p, Y) =5 (P+ e+") (7.90) 
Derivando-se V em relação a t, tem-se que 
V = cé+¢b+ psi (7.91) 
= e(ae+ o@+ Wu) + oFi(e, 2, u, a) + YFple, è, u,b) (7.92) 


ae? + |¢(e8 + File, 2,u,8) ) E [é eu + Fite, 2,15) (7.93) 


Propondo F(.) e Fa(.) da forma 
FaleZua) = —e(t)2(t) (7.94) 
File, £,u,b) 


| 
l 
m 
— 
~œ 
g£ 
+ 
do add 
ql 
No) 
ol 
< 


tem-se que 
V = qe <0 (7.96) 
Com a utilização do lema de Barbalat é possível estabelecer que 


e #30 (7.97) 


De fato, derivando-se V, obtém-se 


V Zaeê (7.98) 
2ae(ae + p? + wu) (7.99) 


que é limitado, pois 
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1. No instante inicial, V(e(0), (0), W(0)) < N para algum N > 0. Como 
V <0, decorre que as funções e(t), o(t) e y(t) são limitadas. 


2. |u(t)| < M por hipótese. 


3. e = x — T é limitada e, como a < 0, x é também limitada, permitindo 
concluir que ĉ é limitada. 


Uma vez que V é limitada, V é uniformemente contínua e, pelo lema de Bar- 
balat, V = —ae? > 0, ou e(t) > 0. 
Identificação de sistemas dinâmicos: caso vetorial 


Considere o sistema linear 
x = Ax + Bu (7.100) 


em que A e B são matrizes constantes desconhecidas e |u| < M. 
Assume-se, ainda, que Re{A{A}} < 0 


Como no caso escalar, seja a proposta de dinâmica para a estimativa 
x = ÂR + Bu (7.101) 


com a meta de fazer A(t) > A e B(t) > B, para t > oo. 


Como antes, defina o erro 
e(t) = x(t) — x(t) (7.102) 


A equação da dinâmica de e(t) é 


è = (Ax+Bu)- (Ax + Bu) (7.103) 
= A(x-%)+(A-A)%+(B-B)u (7.104) 
Por conveniência, são introduzidas as notações 
S(t) = A-Å (7.105) 
W(t) = B-B (7.106) 
A equacao do erro é reescrita, portanto, na forma 
è= Ae+ ®(t)x + U(t)u (7.107) 
Analogamente ao caso escalar, são buscadas as leis de adaptação 
A = © (7.108) 


B= Ü (7.109) 
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Propõe-se como a função candidata de Lyapunov 
V(e, ®, Y) -e!Pe+tr[/676 + PTH} (7.110) 


com P > 0, sendo que deve ser feita, a posteriori, a verificação de que O é 
ponto de equilíbrio. 


A derivada temporal de V é dada por 


V = é'Pe+e’ Pe + 2tr{é7d + Tp) (7.111) 
= (Ae+ 6% + Wu)’ Pe +e’ P(Ae + PR + Wu) + 
42ir{ od + ww} (7.112) 
= e’(A’P+PA)e+ 
-Q 
+2(6% + Wu)’ Pe + 2tr{ 7S + Ww} (7.113) 


= -eTQe +2 |e PER + tr{ 7H} + eT PWu + tr{ WY} (7.114) 
A matriz P pode ser obtida resolvendo-se 
ATP4+PA=-Q (7.115) 


para algum Q = 0. 

A solução P de 7.115 é única e positivo definida pois, por hipótese, A possui 
todos os autovalores no semiplano esquerdo. 

Os termos indesejados em 7.114 são eliminados adotando-se as leis de adapta- 
ção 


& = -Peg (7.116) 
© = -Peu (7.117) 
uma vez que 
ir{™B} = —ir{(Pex")' 6) (7.118) 
= -tr{xe’PS} (7.119) 
e, notando que para a e 8 em R”, 
trlanx1Bixn) = Ba (7.120) 
pode-se escrever que 
UR a (TPE) ) =e P&E (7.121) 
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Analogamente, obtém-se que tr{W7U} = e” Pu. 
Substituindo-se tr{@7 64) = ce" Px e tr{ WG} = e" PWu na expressão de 
V em 7.114, 
V = -e? Qe +2[e™P&x + tr{67S} +e Phu + tr{b7W} (7.122) 
= -eQe +2 |e Pðx — e™Px + el Pyu e Pyu)| (7.123) 
= -elQe (7.124) 
que é negativo semidefinida. 


Considerando, ainda, que (e,B,W) = (0,0,0) é ponto de equilíbrio, pelo 
critério de Lyapunov, o sistema é estável, utilizando a lei de adaptação 7.116 
e 7.117. 


Exemplo de identificação paramétrica 


o 0 1 
> |e = 


considerado desconhecido a menos do fato de que é linear de segunda ordem, 
invariante no tempo, com uma entrada u1xı € o estado x é mensurado a todo 
o instante. 

Utilizando-se a lei de adaptação 7.116 e 7.117, obteve-se o resultado apre- 
sentado graficamente em 7.3. 


Seja o modelo 


: | u (7.125) 


(7.126) 


De fato, as estimativas da matriz A = [a;;] tendem para os valores verdadeiros 
a11 = 0, aig = 1, a21 = —2 e a22 = —3, bem como as da matriz B = [b;] para 
os valores bı = b2 = 1. 


7.4 Backstepping 


Embora o backstepping tenha sido estudado de modo implicito em alguns 
artigos anteriores, a formulação típica vista hoje em dia é devida a 


e Sussmann, H. J. e Kokotovic, P. V. The peakingphenomenon and the 
global stabilization of nonlinear systems. IEEE Transactions on Auto- 
matic Control, v. 36, n. 4, p. 424-440, 1991. 


Para se ter uma boa perspectiva sobre o tema, recomenda-se o artigo 


e Kokotovic, P. V. (1992). The joy of feedback: nonlinear and adaptive. 
IEEE Control Systems Magazine, v. 12, n. 3, p. 7-17, 1992. 
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Identificação - Tempo Contínuo 
T T T 


Matrix B 


0 50 100 150 200 250 300 
Tempo [s] 


Figura 7.3: Exemplo de Identificação de um sistema LTT. 


7.4.1 Exemplo tntrodutório de backstepping 
Considere o modelo não linear de dimensão 2 descrito por 


di = eixo (7.127) 
io = u (7.128) 


No caso de sistemas de segunda ordem são necessárias duas fases. 


Em uma primeira fase, um pseudocontrole v é utilizado no lugar de x2 da 
primeira equação. 


O pseudocontrole v é escolhido de modo que o ponto de equilíbrio da primeira 
equação modificada (com v noi lugar de x2) seja estabilizada. 


Fase 1: 


Assume nesta fase que x2 pode ser visto como um controle virtual v, ou seja, 
ij = r% 


Com o intuito de estudar a estabilidade, adote-se a função candidata de Lya- 
punov 
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Derivando-se V o x4(t) em relação a t, resulta que 


d : 
ad (x(t) = th (7.129) 
= ju (7.130) 
Escolhendo v = —z?, obtém-se que 


d 
a (21(t)) = -zf <0 


Fase 2: 
Pela Fase 1, sabe-se que, se v = —27, então o sistema representado pela 
primeira linha de 7.127 seria estável. 


Idealmente deseja-se que, através da manipulação de u, £2 se aproxime de v, 


cuja expressão será denotada por q(x1) = —x?2. 


Em outras palavras, deseja-se fazer x2 tender a q(x) através da escolha de u. 


Defina o erro e como a diferença e = x2 — q(x1) e note que 


e = xo —q(x1) (7.131) 
z2 = e+g(x1) (7.132) 
O modelo original é, portanto, 
é, = evito (7.133) 
= x} (e+¢(a1)) (7.134) 
to = u (7.135) 


Por outro lado, como t2 = u, pode-se escre3ver a partir de 7.131 que 
é = u-g(x1) (7.136) 
Nas variáveis (x1,e+ a dinâmica é descrita por 


ty = ei(e+a(x)) (7.137) 
e = u— q(x) (7.138) 


A função candidata de Lyapunov é escolhida de modo que aproveita a parte 
referente a zı já obtida anteriormente (Vi (x1)), ou seja, 


Valene) = Wati (7.139) 
2 2 
Ti e 

= — + — .140 

5 + 5 >) (7.140) 
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e a sua derivada é dada por 

oleo) = inte 
—Va(zx,,e) = aiy+ee 
q 2T 171 


Substituindo-se +; e é, tem-se 


Eid) = tı (xi (e+ a(z1))) + e (w— á(21)) 


dt 
= rye + xtq(a1) + eu — eġ( x1) 
Da Fase 1, q(x1) = —x7, de modo que 
d 
ag Vita, e) = rie + rt (==?) + eu — eġ( x1) 
= caf+(2itu-á(m))e 
Fazendo-se 
u= (v1) — a} -e 
obtém-se que 
d . 
vette) = zÊ | (zi Hu ġ(21)) e 


= -g-e <0 
e o modelo original foi estabilizado com o controle 
u = ga)-zxi-e 


= 4(x1) — rÍ — £2 + q(21) 
2£ıtı Ly T2 r? 


= —gf = Qxi xo — r? — T2 


7.4.2 Caso geral 


Considere um modelo na forma 


my. =f (ei) gi) ze 
£2 = U 


(7.141) 


(7.142) 
(7.143) 


(7.144) 


(7.145) 


(7.152) 
(7.153) 


Assuma que existe q(x1) tal que q(0) = 0 e para algum Vi(x1) > 0, diferenciá- 


vel e radialmente ilimitada, é satisfeita a condição 


dV, (x1(t)) = dVi, 
dt dx, | 
dV; 


(7.154) 


(7.155) 
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Assim como no Exemplo Introdutório, deseja-se usar 72 como um controle 
virtual, ou seja, manipular u de modo que x2 > q(21). 


Definindo e = x, —q(x1), obtém-se a mesma equação do Exemplo Introdutório, 


ti = fx) +9(21) (e+ q(21)) (7.156) 
é = u— q(x) (7.157) 


Aproveitando a função V; fornecida, seja Vo(x1,e) = Vi (x1) + r e note que 


Tiii teë (7.158) 

dzı 

= [Fæ + g(#1) (e + q(21))| + e (u — ġ(x1)) (7.159) 
dVı 


dV; 


Vi<0 
dV, 
g NE) +u- i) e (7.160) 


eS 
B 


d 
geL e) 


g(zı)q(zı) + 


+ 


Fazendo-se av 
u = ——g(z1) + į(21) — € 
Tı 


obtém-se que 
V2(x1, €) = V — e? <0 


Expandindo o controle estabilizante u, obtém-se a fórmula 


wee M glai) E: (7.161) 
= -Z ole) + Fli m+ (ar) (7.162) 
= -T ga) + FE [e + alemao] = 42 + ale) (7-163) 
= -Tiet E a) + f gas- 02 + ale) (7-164) 


Exemplo: Considere o mesmo modelo utilizado anteriormente 


a, = eixo (7.165) 
io = u (7.166) 
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ou seja, f(x1) = 0 e g(x1) = x}, e tome-se a mesma função candidata de 


Lyapunov, 
1 
Yi = 57i 
Verifica-se que q(x1) = —a} é adequado e pela fórmula obtida anteriormente 
dV, dq dq 

= SS = 7.167 
u dO go Com ao) Lo 
= ger x TILST — Tə — r? (7.168) 
= -at — 2rÍx — x} — T2 (7.169) 


que é igual ao obtido anteriormente em 7.151. 


7.4.3 Caso de realimentação estrita 


O método do backstepping é também aplicável a sistemas da forma 


dy = fim) + gı(z1)z2 (TATO) 
iz = fə(£1, £2) + g2(x1, 22) x3 (7.171) 
(7.172) 

tay = Fea Pe eg A) + gn—1 (£1, aso ea (7.173) 
in = ndo vs En—1;, En) + Jn(T1, Do ces En—1;, Enu (7.174) 


Os termos gk(£1,..., £k) não devem se anular pois a solução envolve termos 
dr isset]: 

Exemplo de ordem 2 

Considere o problema de estabilizar o sistema modelado por 


ti = fılzı) + gı(zı1)z2 (7.175) 
to = fo(x1, £2) + ga(x1, 2)u (7.176) 


Pela Fase 1, assuma que existe q(x1) e Vi(x1), tal que 


a“ [fi(a1) + 9(@1)a1(21)] < 0 
Tı 


Definindo e = z2—q(x1) obtém-se uma equação similar ao dos casos anteriores, 
com a única diferença do termo entre colchetes. 

ii = fa)+g(x1) (e+ q(z1)) (7.177) 
[fo(v1, £2) + go(a1, 22)u] — g(x1) (7.178) 


é 
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Tomando-se como a função candidata de Lyapunov, novamente aproveitando 
a disponibilidade de Vı (x1) 


2 
e 
Va(x,,e) = Vi(ai)+ T (7.179) 


obtém-se que (omitindo-se os argumentos de f1, fo, g1 € 92) 


d dV, 
dt = ae i 
g Noe = ae (7.180) 
dV, l 
= di [fi +gı (e+ q(21))| +e [f2 + gou — ġ(x1)| (7.181) 
dV, 


= a, [fi + g1)a(x1)] + 
DA 


Vi <0 


dV 
telz 9 + fo + gou — dm) (7.182) 


De modo similar aos casos anteriores, propõe-se a lei de controle 


1 /dV 
u = -— (sin + -ae)-+6) (7.183) 
92 day 
1 /dY dqı dqı 
Ea o pe E PE a 7.184 
E (= git fo E fi E gixo+x2—q(x)| ( ) 


que, substituído na equação de Vz, leva a 

dao e)=V -e <0 
qg Ca ho = 

e o modelo é estabilizado. 


OBS: Note que a lei de controle 7.184 apresenta certa complexidade. 


7.4.4 Controle adaptativo com backstepping 

O método backstepping pode ser utilizado para projeto de controladores adap- 
tativos. 

Aqui, um procedimento simples é ilustrado através de um exemplo. 


Considere o modelo 


Z1 = Of(zı)+zr2 (7.185) 
t2 = u (7.186) 
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em que f:R > R é diferenciável e O é um parâmetro real desconhecido. 


A mesma metodologia anterior é aplicável e toma-se inicialmente um pseudo- 
controle v no lugar de x9. 
čı = Of (x1) +v 


Seja agora uma função candidata de Lyapunov 


1 
Derivando-se V no tempo e propondo v = —8 f (x1) — x1, tem-se que 
v = ni? (7.187) 
= a (9f(x1) +v) (7.188) 
=z? <0 (7.189) 


Deseja-se agora que x2 se aproxime de v mediante manipulação de u (já que 
v foi usado como um pseudocontrole no lugar de x9. 


Denotando v = qy(x1), pode-se definir o erro 


e = v—q(z1) (7.190) 
z2 = e+q(zı) (7.191) 
e obtém-se o sistema 
dj = Of(x1)+e+q(21) (7.192) 
é = u— qi (zı) (7.193) 


lembrando que £2 = u. 


Propondo-se a função candidata de Lyapunov 


1 1 
Vo = 57 + nd 


e derivando-se Vz em relação a t, 


V = min+eé (7.194) 

= 11 (Of (x1) +e+ qı(zı)) +e (u — gi(1)) (7.195) 

= a (0f(r1) +q(21)) + e (xı + u — q(x1)) (7.196) 

Substituindo-se g(x1) = —zı — 0f(x1) e adotando-se u = —zı + q(x1) — e 


resulta que 


V = -r-e <0 (7.197) 
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Porém, O não é conhecido e, portanto, pelo principio da equivalência à certeza, 
substitui-se O por uma estimativa O na expressão qg(x1) = —x, — Of (x1) 


Gi (x1) = -z1 — Of (21) 
A nova expressão para (41) é 


Ly = Of (1) + T2 (7.198) 
0 f(m) +e + (mi) (7.199) 


e para (é) é 


è = u — G,(21) 
Seja, 0 = 0 — ĝ e note que = 0, ja que O é constante. 


Uma expressão para 8 será obtida através do critério de Lyapunov. 
Para analisar a estabilidade de 


tı = Of(x1ı)+e+ (zı) (7.200) 
é = u- (z) (7.201) 
0 = aser definido (7.202) 


adote-se a função candidata de Lyapunov 
v=; (ai +e + 6?) 
Calculando-se a derivada de V em relação ao tempo, 
V = aya, +6 +60 (7.203) 
tem-se que 
V = q (0f(#1) +e+H(21)) +e (u — im) +60 (7.204) 
ae (0f(21) +e-—a2- 6f(x1)) +e (u — (21) + 60 (7.205) 


= 07 + |(0- 6) f(a1) + 00] +e[eit+u—G&(er)] (7.206) 
= 
0 

-x1 — (f(1) + 6) O@+e [ma +u-— @(21)| (7.207) 


Seja 


—f(x1) (7.208) 
u = —21+9,(r1) —e (7.209) 
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Com essas escolhas para O e u, resulta que 


V =- -e <0 


Portanto, com a lei de adaptação 


e com o controle 


u = -rı + (rı) -e (7.210) 
(7.211) 


e a estabilidade é verificada, uma vez que (0,0,0) é ponto de equilíbrio. 


Nesta seção, o critério de Lyapunov foi utilizado para obter uma lei de adap- 
tação tal que V < 0. Ou seja, a função candidata V envolvia funções ainda 
não determinadas (no exemplo, Phi e Psi, respectivamente) que, posterior- 
mente, foram escolhidas de modo que tornassem V semidefinida negativa. 


7.5 


Observações Complementares 


. Existem alguns métodos sistemáticos para construir funções candidatas 


de Lyapunov, tais como o método de Zubov e o de Gradiente Variável 
(vide (CASTRUCCI; CURTI, 1981)). 


. Segundo o Teorema Recíproco de Lyapunov, se um modelo é sabidamente 


estável, então é possível construir uma função candidata de Lyapunov.1 


. Embora existam critérios de instabilidade como a de Cetaev, são pouco 


utilizados em projeto de controladores. 


. Quando a função V é apenas semi-definida negativa, pode-se, às vezes, 


utilizar o princípio de conjuntos invariantes de LaSalle (LaSalle, J.P. 
Some extensions of Liapunov's second method, IRE Transactions on 
Circuit Theory, CT-7, pp. 520-527, 1960). 


. Mais adiante é apresentado o Lema de Barbalat que permite concluir 


que V > 0 se V é limitada. 


. Quando ocorrem autovalores no eixo imaginário ao se aplicar o primeiro 


método de Lyapunov (pontos fixos não hiperbólicos), pode-se, às vezes, 
utilizar o Teorema da Variedade Central. 
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7.6 Observações sobre pontos de equilíbrio 


Em se tratando de sistemas não lineares, um ponto de equilíbrio xg para o 
qual as trajetórias convergem pode não satisfazer a definição de estabilidade, 
ou seja, a trajetória x(t) não deve “sair” da vizinhança B.(xg) (em termos 
formais, dado € > 0 existe ô > 0 tal que |x(t) —xp| < € se |x(to) — xg] < ô). 


Considere o sistema descrito por 


à = m(1-2]-23)-02/1 — - (7.212) 
Ti+ T3 
a (7.213) 


io = np (1-2) — 23) +m gig 


O ponto (1,0) é um ponto de equilíbrio para o qual as trajetórias convergem, 
mas após percorrer trechos de uma circunferência de raio 1, como visto no 
plano de fase A da figura 7.4. 


O plano de fase B da figura 7.4 apresenta trajetórias típicas percorridas pela 
solução da equação de Vinograd (Vinograd, R. E. Inapplicability of the method 
of characteristic exponents to the study of non-linear differential equations. 
Matematicheskii Sbornik, v. 41, n. 4, p. 431-438, 1957) 

vilas — £1) + 23 

= Git add + (Trap di 

x3(xq — 2x1) 


(zi + 23)(1 + (wt + 23)? 


ti (7.215) 


Aqui, embora o ponto (0,0) seja atrator, esse não é um ponto de equilíbrio. 


Existem várias extensões do critério de Lyapunov que permitem analisar 
processos híbridos, processos com atraso puro, processos com ordem fracio- 
nária e muitos outros. Sob uma perspectiva diferente o método de Lyapunov 
é utilizado para projeto de controladores adaptativos e para identificação de 
sistemas. 


7.7 Notas históricas sobre o critério de Lyapunov 


Alguns resultados notáveis que estendem o critério de Lyapunov. 
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0.5 


-0.5 


Figura 7.4: Planos de fase de modelos que apresentam dificuldades na definição 
de pontos de equilíbrio estáveis. 


e Vasile Mihai Popov (1928-) estudou o problema de Lur'e-Postnikov (Lur’e, 
A. I. e Postnikov, V. N. On the theory of stability of control systems 
(em russo). Prikladnaya Matematika I Mekhanika, v. 8, n. 3, p.246-248, 
1944) e propôs, mais tarde em 1966, a teoria de hiperestabilidade de 
sistemas dinâmicos. 


Em 1945, Mark Aronovich Aizerman (1913-1992) e Felix Ruvimovich 
Gantmacher (1908- —1964) analisam o problema de estabilidade abso- 
luta. (Aizerman, M. A. e Gantmacher, F. R. Die absolute Stabilitãt von 
Regelsystemen (republicado como suplemento: Die absolute Stabilitat 
von Regelsystemen. Beiheft zur Zeitschrift Regelungstechnik, 1965). 


O princípio de Barbashin-Krasovskii-LaSalle foi proposto, de modo in- 
dependente, por Nikolay Nikolayevich Krasovsky (1924-2012) e Joseph 
Pierre (Joe) LaSalle (1916-1983), respectivamente em 1959 e 1960. Um 
caso especial já havia sido apresentado em 1952 por Barbashin e Kra- 
sovskii. Barbashin, E. A. e Krasovskii, N. N. On the stability of motion 
as a whole (em russo). Doklady Akademii Nauk SSSR, v. 86, p. 453- 
445, 19526. LaSalle, J. P. Some extensions of Liapunov’s second method. 
IRE Transactions on Circuit Theory, v. 7, p. 520-527, 1960. Krasovskii, 
N. N. Problems of the Theory of Stability of Motion (em russo), 1959. 
Tradução para o inglés: Stanford University Press, Stanford, CA, 1963. 


(2)) 


e Em torno de 1990, vários autores, incluindo Petar V. Kokotovic (1934-), 
desenvolvem a teoria de backstepping control, que permite, entre outras 
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possibilidades, um projeto recursivo sistemático de controladores não 


lineares. 


— 


BRR 


Lyapunov Krasovski Popov LaSalle Kokotovic 


7.8 Exercícios 


7.8.1 Exercício: Estabilidade de pontos de equilíbrio 


Investigar a estabilidade dos pontos de equilíbrio da equação de Van der Pol 


tı = —T? 


io = zı + (2-1) 2» 


7.8.2 Primeiro método de Lyapunov 


(7.216) 
(7.217) 


Investigar a estabilidade dos pontos de equilíbrio utilizando o primeiro método 


de Lyapunov. 


1. 
mo. 2 
Ti = T2 (1 + T1 — £5) 
. 2 
to = xı(1+ 22-27) 
2. 
gi = r3 — T2 
o 2 2 
to = (x)+75-2)2 
3. 
Dj = ri = r3 
; 2 
to = 2a(xj— 22) 
4. Assumindo que a > 0. 
ee 2 
TY = T1 — Ti AXM12X2 


to = 2%- r2 — ax1x2 


(7.218) 
(7.219) 


(7.220) 
(7.221) 


(7.222) 
(7.223) 


(7.224) 
(7.225) 
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7.8.3 Exercício: Segundo método de Lyapunov 


Considere um processo descrito por 


tı 


t2 


= T2 


ls 
= Ut + zT] T2 


3 


(7.226) 
(7.227) 


(i) Investigar a estabilidade da origem utilizando o primeiro método de 


Lyapunov. 


(ii) Investigar a estabilidade da origem utilizando o segundo método de 


Lyapunov. 


Observação: Uma função candidata de Lyapunov pode ser encontrada 


escolhendo-se convenientemente os coeficientes de um polinômio. 


7.8.4 Exercício: Segundo método de Lyapunov 


Investigar a estabilidade do ponto de equilíbrio do sistema descrito por 


em que 

) 

) = 
Ns 
) 


> 


0; -I<é<1;VE0 
0; -I<é<1;VE0 


Observação: Uma função candidata de Lyapunov é 


Vrum) = f" IEE + 523 


7.8.5 Exercício: Critérios de estabilidade de Lyapunov 


Considere o processo 
tı 


To 


= T2 


— sin(x1) — x2 


Estudar a estabilidade desse processo utilizando: 
(i) o primeiro método de Lyapunov 


(7.235) 
(7.236) 
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ER eens la (7.237) 


(ii) o segundo método de Lyapunov com a função candidata 


V(x) = 5x" Px (7.238) 


para uma escolha adequada de P. 


7.8.6 Exercício: Polos do eixo imaginário 


i = —x3 — r3 (7.239) 
ty = 21-23 (7.240) 


(i) Estudar a estabilidade da origem pelo primeiro método de Lyapunov 

(ii) Obter a solução fechada da equação linearizada para uma condição 
inicial nao nula 

(iii)Estudar a estabilidade da origem pelo primeiro método de Lyapunov 

(iv) Comentar os resultados obtidos. 


7.8.7 Exercício: Estabilidade de sistemas nao autônomos 


O coeficiente de atrito viscoso de um sistema mecânico pode variar devido às 
alterações no lubrificante. Considere, então, um pêndulo em que o sistema de 
pivo é lubrificado com uma graxa que degrada com o tempo segundo descrito 
pelo coeficiente g(t), tal que 


0 < a<a<g(t)<B<o; Vte [0,c) (7.241) 


d 
(O <y<2 (7.242) 


em que a, a, 5 e y são constantes positivas. Investigar a estabilidade desse 
pêndulo, modelado por 


Ly = T? (7.243) 
to = —sin(x1) — g(t)xre (7.244) 


utilizando a função candidata de Lyapunov 


V(t, x)= (a sin(x1) + x2)? + (1 + ag(t) — a?)(1 — cos (21) (7.245) 
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7.8.8 Exercício: Lema de Barbalat 


Sabendo-se que a > 0, mostrar, se for o caso, que e(t) > 0 para t > oo 


é =w (7.246) 
w = —sin(0) — aw (7.247) 
e as condições iniciais são 
9(0) = 1 (7.248) 
w(0) = 1 (7.249) 


Observação: Sugere-se como a função candidata de Lyapunov 


1 
V(0,w) = (1 — cos 0) + su? (7.250) 


7.8.9 Exercício: Utilização do lema de Barbalat 
Considere o processo descrito por 


—sign(k) x(t) r(t) (7.251) 
io = —axo(t)+ka1(t)r(t) (7.252) 


tı 


em que a > 0, k é uma constante real e |r(t)| < M < œ para Yt € R. Verificar 
se é possível concluir que xa(t) — 0 à medida que t — oo, utilizando a função 
candidata 


1 
V (x1, £2) = 5 (23 +k sign(k) xt) (7.253) 


7.8.10 Exercício: Identificação com termos não lineares 
Considere um processo descrito por 
&=axt+af(x) + Bg(u) (7.254) 


em que a < 0 e os parâmetros a e B são constantes mas desconhecidos. 
Assume-se que as funções f : R > Reg: R > R sao conhecidas e dife- 
renciáveis, com f(0) = 0 e g(0) = 0. Como mostrado no texto, obter uma lei 
de adaptação para à, à e B usando a proposta 


È = GF + âf (æ) + glu) (7.255) 


Definir e = x — € ¢6=a-G,W~=a-Q, X= B-B e utilizar a função candidata 


V= ; (e +g +y? + x”) (7.256) 


Métodos no domínio 
transformado 


“You can't control what you can't measure.” 
— Tom DeMarco 


Este capítulo busca focar alguns métodos de projeto de controladores no domi- 
nio transformado (ou domínio da frequência) em que o modelo está na forma 
de funções de transferência. 


Exceto quando especificado em contrário, admite-se que o modelo tratado é 
SISO, embora muitos dos resultados possam ser estendidos para o caso multi- 
variável. 


8.1 Vantagens do controle em malha fechada 


O controle em malha aberta, além de ser estruturalmente mais simples, pode 
ser economicamente vantajoso em termos de custo, já que não se incorre em 
gastos com sensores e o processamento de suas medidas. 


Um exemplo prático é o caso de dispositivos acionados por motor de passos, em 
que a rotação do eixo é proporcional ao número de passos comandados, desde 
que não haja stall (o motor recebe o pulso mas não possui torque suficiente 
para movimentar o eixo). 


Porém, a estrutura de controle em malha fechada apresenta várias vantagens 
decorrentes do fato de que o resultado das ações de controle é monitorado 
pelos sensores, como se apresenta a seguir. 
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8.1.1 Robustez a incertezas no modelo 


Um modelo sempre apresenta que podem advir de uma série de fatores tais 
como o desconhecimento de alguns fenômenos que afetam os processos, apro- 
ximações para simplificar o modelo, variações no processo devido a alterações 
do ponto de operação ou envelhecimento de componentes, entre muitas outras 
possibilidades. 


Sem realimentação Com realimentação 
u 
i 


Figura 8.1: Amplificador com incerteza no ganho. 


Considere um amplificador de ganho A e incerteza AA, conectado em malha 
aberta como no lado esquerdo da figura 8.1. 


A saída y é dada, em função da entrada u, pela equação 


y = (A+AA)u (8.1) 
Au+ AAu 


e, quando não há incertezas, o seu valor é 
Ynom = UA geo = Au (8.3) 


Supondo agora que a incerteza do modelo é de 10%, 


aa x 100% = 10% (8.4) 


tem-se que a saida possui um erro percentual de 


— ynom A AA = A 
thon 499, = SEE A x 100% (8.5) 
Ynom Au 
AA 
= 10% (8.7) 


Portanto, sem realimentação, a incerteza sobre o modelo é diretamente trans- 
ferida para a saída. 

Considere agora o mesmo amplificador de ganho A e incerteza AA, conectado 
em malha fechada como no lado direito da figura 8.1. 
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Observando-se a figura 8.1, é imediato verificar que 


e = uy (8.8) 
y = (A+AA)e (8.9) 
ou seja, 
y = (A+AA)(u—-y) (8.10) 
y(1+A+AA) = (A+AA)u (8.11) 
A+AA 
= T+ A+R” (8.12) 


Quando nao ha incertezas, a saida é dada por 


A 


Ynom = IX A TA! (8.13) 
e, supondo novamente que a incerteza do modelo é de 10%, 
AA 
= x 100% = 10% (8.14) 
tem-se que a saída possui um erro percentual de 
na AFAA ,,_ A 
+ rem 100% = HAtdA o JA x 100% (8.15) 
Ynom TAU 
1 AA 
100 8.16 
ee ea ae ere) 
1 
= ———]0 8.17 
1+A+AA Á ( ) 


Supondo que foi escolhido o valor A = 100, a equação 8.17 permite escrever 


Y — Ynom 1 
> x 100% = ———_———__10 8.18 
Ynom x 7 1+ 100+ 10 % ( ) 


de modo que o erro percentual da saida se situa na faixa 


Y— Ynom 


Yn om, 


x 100% € [0.9, 1.1] % (8.19) 


8.1.2 Rejeição de distúrbios 


Um sistema está sempre sujeito a ruídos que podem ser de diversas naturezas 
(viés, ruído de banda larga, spikes etc). 
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Sem realimentação Com realimentação 


Figura 8.2: Efeito do ruído de saída n em um sistema de malha aberta (à 
esquerda) e em um sistema de malha fechada (à direita). 


Considere a saída de um amplificador de ganho A, sujeito a um ruído aditivo 
n (lembrando noise) e conectado em malha aberta, como ilustrado no lado 
esquerdo da figura 8.2. 

Diretamente da figura 8.2, tem-se que 


y=Au+n (8.20) 
ou seja, Se Ynom é a saída quando não há ruído, 
Ynom = Au (8.21) 
observa-se, em vista da equação 8.20 e da figura 8.2, que 
Y = Ynom +n (8.22) 


Logo, o ruído está se superpondo diretamente ao sinal de saída. 


Considere, agora, o caso realimentado, ilustrado na parte direita da figura 8.2. 
Novamente, por inspeção, 


e u— y .23 
y = n+ Ae (8.24) 
que, rearranjando, fornece 
y = n+A(u-y) (8.25) 
= n+ Áu + Ay (8.26) 


Explicitando-se y a partir da equação 8.26, tem-se 


ER E EESE 
"RA 1+A 


e chamando de Ynom O caso sem ruído, 


y 


A 
Ynom = IJA u 
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resulta que 
1 
Y = Ynom + IL A E A (8.29) 


Fazendo-se A = 100 na expressão 8.29, verifica-se que o ruído é atenuado em 
aproximadamente 100 vezes, 


Y = Ynom + 0.01 n (8.30) 


8.1.3 Modificação das características de estabilidade 


Considere um integrador puro (ideal) operando em malha aberta, como ilus- 
trado no lado esquerdo da figura 8.3. 


Sem realimentação Com realimentação 


Figura 8.3: Um sistema para ilustrar o efeito da realimentação sobre a estabi- 
lidade. 


Se o sinal de entrada u é do tipo degrau unitário, 


u(t) = (8.31) 


a saída correspondente, a partir de y (0) = 0, é 


nt = fumar (8.32) 
z foe (8.33) 

0 
= t (8.34) 


que é um sinal que cresce indefinidamente (até violar as condições para a va- 
lidade do modelo). 


De fato, este sistema é instável no sentido “saída limitada para entradas 
limitadas” (bounded input bounded output - BIBO). 


Fazendo-se uma realimentação como ilustrado na parte direita da figura 8.3 e 
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admitindo que y (0) = 0, tem-se que 


y (t) f r. (8.35) 
e(t) = u(t)—-y(t) (8.36) 


Diferenciando-se ambos os lados de 8.35 e substituindo-se a expressão do erro 
8.36, obtém-se que 


y = e(t) (8.37) 
= u(t) — y(t) (8.38) 


cuja solução para caso de u(t) do tipo degrau unitário 


O set <0 
u(t) =| ee: (8.39) 
é 
y(f)=1-e* (8.40) 


como pode ser verificado por substituição de 8.40 em 8.38. 


Logo, com a realimentação, y(t) — 0 à medida que t > oo para u(t) degrau 
unitário. 
8.2 Compromissos entre requisitos 


Considere uma malha de controle em que há ruídos de processo D(s) e de 
medida N(s), conforme ilustrado na figura 8.4. 


D(s) 


R(s) + U(s) 


Figura 8.4: Uma configuração básica de malha de controle evidenciando as 
entradas de perturbações exógenas D(s) e ruído de medida N(s). 


Os sinais de excitação de interesse são D(s), N(s) e R(s) enquanto as gran- 
dezas notáveis são Y(s), E(s) e U(s) (argumento s omitido para efeito de 


Métodos no domínio transformado 231 


simplicidade). 
Gp GpGo GpGo 
Y = D N R 8.41 
1+ GpGo 1+ GpGo a 1+GpGe 
Gp 1 1 

B= D N R 8.42 

1+ GpGo 1+ GpGo Le Paar ( ) 

U = Ca, CO Np OOR (8.43) 


1+ GpGo 1+ GpGo 1+ GpGo 
Para facilitar a notação é conveniente definir o ganho de malha aberta L(s) 
L(s) = Gp(s)Go(s) (8.44) 


As seguintes funções de transferência recebem denominações especiais de sen- 
sitividade S(s) e de sensitividade complementar T'(s), em vista da importância 
desses em projetos de controladores. 


1 


S = ESTO) (8.45) 
_ _ Ls) 
DS LO (8.46) 


É também usual que sejam definidas, ainda, 


Cc Gp(s) 

o> iga en 
Gels) 

"> Isua (e 


e reescrever as equações 8.41, 8.42 e 8.43 na forma 


Y(s) = Q(s)D(s)—T(s)N(s)+T(s)R(s) (8.49) 
E(s) = —Q(s)D(s) — S(s)N(s) + S(s)R(s) (8.50) 
U(s) = —T(s)D(s) — R(s)N(s) + P(s)R(s) (8.51) 


A condição para estabilidade da malha fechada é que as raízes da equação 
1+L(s) =0 (8.52) 


estejam todos no semiplano esquerdo (SPE). 


Para que a saída y(t) restreie bem a referência r(t), o erro e(t) = y(t) — r(t) 
deve ser pequeno em algum sentido, ou seja, ||e|| deve ser pequeno em relação 


a Ilyl. 
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Tendo-se em vista que 
E(s) = S(s)R(s) (8.53) 


a condição de bom rastreamento da referência requer que a sensitividade S 
seja pequena em algum sentido, ou seja, ||S(s)|| pequena. 


Por outro lado, para se ter uma boa rejeição do ruído de medida n(t) na saída 
y(t), deve-se ter, analogamente, ||T(s)|| pequena, já que 


Y(s) = T(s)N(s) (8.54) 
Uma forma de se definir ||S(s)|| (ou ||T(s)||) é 
|5(5)lloo = sup |S(j00)] (8.55) 
Observação: No caso de modelos multivariáveis, utiliza-se 


|S(S)lloo = sup (omax[S(J~)] ) (8.56) 


em que Omax|S(jw)| denota o maior valor singular de S(jw). 


Uma dificuldade fundamental é que, para cada s, 


S(s) +T(s) = | IG ta SA (8.57) 
_ 14+L(s) 
a O) (8.58) 
= 1 (8.59) 


e não se pode ter, para um dado s = jw, |S(jw)| e |T(jw)| simultaneamente 
pequenos. 


Felizmente, o bom rastreamento está relacionado com sinais de baixa frequên- 
cia e basta ter |S ( jw)| pequeno em baixas frequéncias. 


Por outro lado, ruidos na saida sao, em geral, relacionadas com frequéncias 
elevadas, de modo que IT( jw)| deve ser pequeno. 


Assuma, agora que o modelo G(s) possui incertezas aditivas de modelagem, 
representado por um modelo nominal Gy” com incerteza AG p (s) 

G(s) = GP” (s) + AGp (8) (8.60) 
e se deseja baixa sensibilidade da saída com respeito à incertezas no modelo 
ao se utilizar um controlador Gc(s). 
Se y(t) é a saída do modelo nominal correspondente a uma referência r (t) 


_ GP™ (s) Go (s) 
Y (8) = 1 Gm") Gol) 


R(s) (8.61) 
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a saída real é dada por (omitindo os argumentos s) 
[GM e AGP] Go 
1+ [GET + AGP] Go 

GP”Go AGpGe 
nom ! 2 
1+ GP Go (1 E GE"Go) 


Y+AY R (8.62) 


K 


R (8.63) 


em que é utilizada uma aproximação de primeira ordem. 


Observando-se a equação 8.63, tem-se a aproximação 
AGpGo 


AY = : 
(1+ @pmac) 


R (8.64) 


donde, em termos relativos, 


|AY || AGpGo 1+ GR” Go 


o | 2 nom | (8.65) 
pd] (1+ proc) GENGo 
1 AGp 
= Ill nl (8.66) 
e, portanto, de um modo não rigoroso, 
ll 1 
Y = S 

||AGpIl o Il 1+ GENGo I = ILS] (8.67) 
IGP” | 


que representa o “percentual” de erro na saída y em relação ao “percentual” 
de erro no modelo (multiplicando o numerador e o denominador por 100%). 
Logo, a baixa sensibilidade da saída a incertezas aditivas no modelo requer 
|S ( jw)| pequeno, em algum sentido, para a frequéncia de interesse. 

De modo geral, o rastreamento e a robustez a incertezas aditivas no modelo 
requerem ||S|| pequeno, porém a rejeição de ruídos na saída necessita ||T'|| 
pequeno, o que é conflitante, lembrando que S(s) + T(s) = 1. 


Em aplicações em que existem incertezas, é fundamental a utilização do 
conceito de realimentação. Como visto nesta seção, a realimentação permite 
alterar as características de estabilidade, de reduzir o efeito de perturbações 
exógenas e ruídos, bem como diminuir o efeitos do erro de modelagem. É 
também importante ressaltar que muitos objetivos no projeto de controla- 
dores são conflitantes entre si, o que possui reflexos na escolha das especifi- 
cações de desempenho. 
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8.3 Controladores liga-desliga 


A análise de controladores que envolvem chaveamentos pode não ser trivial 
devido à sua natureza não linear. 


Por outro lado, no caso específico em que o processo a ser controlado é linear e 
apenas o atuador é do tipo liga-desliga, a análise do comportamento do sistema 
pode ser relativamente simples. 


Para modelos de primeira e segunda ordens, pode-se projetar controladores 
liga-desliga, frequentemente, usando métodos gráficos. 


Ainda, para modelos que apresentam oscilações sustentadas, as amplitudes e 
as frequências podem ser estimadas usando uma aproximação pela primeira 
harmônica do eventual sinal periódico mais complexo. 

O controle de modelos SISO-LTI utilizando dispositivos não lineares como 
relés, amplificadores com saturação, caixas de engrenagens com folga, juntas 
com atrito seco e outros mecanismos são apresentados em textos clássicos 
tais como (MIRA, 1969; VEGTE, 1990; GIBSON, 1963; NETUSHIL, 1976; 
SHINNERS, 1972), entre outros. 


8.3.1 Sistemas de primeira ordem 


Considere um processo de primeira ordem descrito por 
t = a(u)x + bu (8.68) 


em que a variável entrada u pode assumir apenas dois valores {wos fo ton } e 


= e A (8.69) 
Aoff SEU = Uoff ` 


A utilização de a(u) distinto para u = Uon € u = uoff é interessante quando 
há dinâmicas diferentes, como no caso do ferro elétrico. O seu aquecimento 
se deve ao elemento resistor, enquanto o esfriamento se deve à dissipação de 
calor nas roupas sendo passadas e ao meio ambiente. 

A notação é simplificada, sem perda de generalidade, se o valor £m para o qual 
tende a saída seja assumido ser 0, conforme visto na figura 8.5. 


Necessita-se agora, para efeito de projeto, obter expressões para os cálculos de 
tr e de T, dados Zon € Toff- 


Sabendo-se que a solução de 8.68 é dada por 


sie )+ 0) + fen \-) bur) dr (8.70) 
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+ 


Figura 8.5: Comportamento típico do sinal de saída de um modelo de primeira 
ordem controlado por um dispositivo liga-desliga. 


a expressão para t, pode ser obtida a partir de 


tr 

z(tr) = | ern) dr buon (8.71) 
0 

= Mon (1 — esente) (3.72) 
Qon 


Para obter T = ton + toff, utiliza-se um o procedimento análogo ou, mais 
especificamente, 


ton 
Toff = elon (ton) t on + f eon (ton—7) dy b uon (8.73) 
0 


tof f 
Lon = estes aogp + | ero ttott— Ndr buoss (8.74) 
0 


8.3.2 Plano ou retrato de fase 


Para processos de segunda ordem é possível representar as soluções da equação 
diferencial (trajetórias) a partir de condições iniciais dadas, mediante o uso de 
métodos gráficos no plano (2D). 


Considere um processo genérico descrito pelo sistema de duas equações dife- 
renciais ordinárias 


à = fılzı, x2) (8.75) 
io = fə(zı, xo) (8.76) 


Tome-se um ponto genérico (71,72) pertencente ao plano { 271, £2 }. 


A inclinação da trajetória (xı (t), x2(t)), quando passa por esse ponto, é dada 
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por 
dx 
m= A (8.77) 
dt (T1,72) 
_ fale, 2) (8.78) 
fix, £2) (1,22) 
A 
gi ee (8.79) 
Azı _ 
( 1,72) 
levando em consideração que 
dx; = . xilt + At) = xilt) i 
dt kar At PET ae eee) 
Att) 
= l i4= 1,2 8.81 
aay a an (8.81) 


O conjunto de segmentos (ou setas) indicando a inclinação das trajetórias no 
plano {x1, £2} será referido como o campo de vetores (embora esse conceito 
seja mais geral). 

Exemplo de plano de fase 

Considere um modelo LTI de segunda ordem na forma de espaço de estados 


Ly = T2 (8.82) 
—5%1 = 6x2 (8.83) 


t2 


Em cada ponto (z1, z2), a inclinação m da trajetória (solução de 8.82+8.83) 
é dada por 
-571 — 6T 
T2 
Para facilitar a visualização é usual representar a inclinação da trajetória em 
cada ponto (z1, Z2), por uma pequena seta 7, representando a direção de 
movimento. 


A figura 8.6 ilustra um exemplo do campo vetorial e algumas trajetórias típicas 
para o processo 
O plano {gz1, £2} será referido, doravante, como plano de fase. 
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Inclinação m 


wT 
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Figura 8.6: Determinação do campo de vetores. 


8.3.3 Relés ideais 


O plano de fase pode ser utilizado para analisar sistemas LTI com atuadores 
liga-desliga. 


Considere que um processo descrito por 


5 


a 8.85 
s2+6s+5 ( ) 


G(s) 


é controlado por um relé liga-desliga 


10 
R(s) = Tt Y(s) 


s*+6s+5 


Figura 8.7: Processo LTI controlado por um mecanismo liga-desliga. 


Uma realização para essa função de transferência G(s) é 


tj = 49 (8.86) 
to = —57 — 6x, + 5u (8.87) 
y = ti (8.88) 


com a vantagem de se poder interpretar x2 como a velocidade de variação de 
Lis 
Na configuração ilustrada na figura 8.7, o atuador liga-desliga aplica um sinal 
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u de 0 ou de 15 unidades, dependendo do sinal de erro e(t) = £L~![E(s)]. 
A referência r(t) é assumido ser do tipo degrau de 10 unidades. 


Para se fazer um esboço do plano de fase para processos cuja entrada é cons- 
tante entre chaveamentos do relé liga-desliga, as etapas básicas são: 


1. obter trajetórias típicas da saída do processo, (y(t) nesse exemplo), 
quando a entrada é constante, ou seja, O ou 15, que são os valores da 
saída do relé. Para o processo deste exemplo, as trajetórias são do tipo 
ilustrado à direita da figura 8.6. 


2. obter o lugar geométrico dos estados em que há comutação do relé liga- 
desliga. Observa-se pelo gráfico característico do relé que o chaveamento 
ocorre para e(t) = 0. 


Pelo diagrama de blocos 8.7, 
e(t) = 10 — y(t) (8.89) 


de modo que o lugar geométrico dos pontos de comutação é uma reta, 
doravante denominada de reta de comutação y(t) = 10. 


Para a realização que será utilizada aqui, x = ye x2 = y, a reta de 
comutação, no plano de fase, será zı = 10. 


3. a reta de comutação dividiu o plano de fase em dois semiplanos. No 
semiplano esquerdo, y(t) = x1(t) < 10, de modo que o relé estará com a 
saída u(t) = 15. Logo, nessa região, deve-se ter trajetórias corresponden- 
tes a entradas constantes u(t) = 15. No outro semiplano, por raciocínio 
análogo, as trajetórias devem ser correspondentes a u(t) = 0. 


Embora seja possível esboçar o campo vetorial manualmente para se analisar 
a malha de controle, optou-se neste texto por visualizar o comportamento do 
sistema através de simulação digital, com resultados apresentados na figura 
8.8. Uma trajetória típica que se inicia com o processo em repouso (ou seja, 


(x1, £2) = (0,0)) pode ser vista no lado esquerdo da figura 8.8. 


No lado direito dessa mesma figura, constata-se que a saída atingiu o valor 
correto e os efeitos das comutações do dispositivo liga-desliga são quase que 
imperceptíveis. 

Em termos heurísticos, o relé aplica o maior esforço possível até que a saída 
atinja as proximidades do valor de referência, quando então passa a chavear 
entre as condições de ligado e de desligado, conforme visto no plano de fase da 
figura 8.8, que apresenta segmentos de trajetória comutada nas proximidades 
de x; = 10. 
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G(s)=5/(S+55+6), U(s)=5/s e rele=[0,15] 


G(s)=5/(S+55+6), U(s)=5/s e rele=[0,15] 


y-dot 
à 


“o 2 4 6 8 : 
t{s] 


Figura 8.8: Plano de Fase correspondente à resposta degrau de 10 unidades 
do processo ilustrado. 


8.3.4 Oscilacoes e a realimentação tacométrica 
Considere um modelo muito simplificado de controle de rotação em um único 
eixo rotação de um satélite. 


Em vista do ar rarefeito, o efeito do amortecimento aerodinâmico é muito 
pequeno, de modo que a sua dinâmica é bem aproximada por 


ry = T2 (8.90) 
io = u (8.91) 


em que o atuador que fornece a entrada u consiste de um par de propulsores 
a gás para aplicação de torque. 


Os diagramas de blocos correspondentes aos casos sem e com realimentação 
tacométrica estão apresentados nas figuras 8.9 e 8.11. 


U(s) p Y(s) 
> z | > 


Figura 8.9: Controle liga-desliga, de um processo sem dissipação e sem reali- 
mentação tacométrica. 


Como o processo é um duplo integrador, as trajetórias no plano de fase (x1, £2) 
são compostas por parábolas para entradas constante por partes (correspon- 
dentes aos intervalos em que o relé está em —5 ou +5). 
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De fato, no eixo (x2) tem-se simplesmente a integração de uma constante 
(u = +5), correspondendo, portanto, a um crescimento linear e no eixo (x1) a 
sua integral x2, ou seja, crescimento quadrático. smallskip 
Consequentemente, a composição para cada entrada constante a trajetória é 
uma parábola. 


Para o caso da estrutura sem a realimentação tacométrica, as trajetórias típi- 
cas no plano de fase obtidas mediante simulação digital para variados valores 
de condições iniciais ((0, 0), (5,0) e (9,0)) são vista na figura 8.10. As respos- 
tas temporais podem ser vistas à direta nessa figura. 

Constata-se pelo gráfico da figura 8.10 que a resposta é oscilatória e a ampli- 
tude de oscilação depende da condição inicial. Na prática, como sempre há 


Gis)=5/S*, rele=[-5,5] G(s)=518, rele=[-5,5] 


y-dot 
oO 
T 
1 
[j 
! 
! 
1 
[j 
! 
1 
1 
H 
< a pi 


tis] 


Figura 8.10: Comportamento do processo controlado por relé, apresentando 
oscilação cuja frequência e amplitude dependem da condição inicial. 


algum mecanismo de perda de energia, as trajetórias não seriam perfeitamente 
fechadas e tenderiam a apresentar amortecimento. 


Um método para mitigar o problema da oscilação sustentada é introduzir, na 
malha de realimentação, um sinal de tacômetro (ou girômetro, no caso rotacio- 
nal). A estrutura com a realimentação tacométrica, da figura 8.9, foi simulada 
digitalmente utilizando o parâmetro À = 0.2. 


A figura 8.12 apresenta o plano de fase da estrutura de controle com a reali- 
mentação tacométrica. 
Aparentemente a resposta degrau, vista à direita da figura 8.12, não apresenta 


comportamento oscilatório. 


Porém, um exame mais cuidadoso do plano de fase à esquerda da figura 8.12 
indica um comportamento um tanto quanto irregular na parte final da traje- 
tória, ainda que esteja convergindo para o ponto desejado (10,0). 
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10 
Ros aa 


Figura 8.11: Controle liga-desliga, com realimentação tacométrica de ganho 


A. 


G(s)=5Is2, rele=[-5,5], ganho tacométrico=0.2 


G(s)=5/s2, rele=[-5,5], ganho tacométrico=0.2 
T T 


Movimento 
Deslizante 


Retade ^ 
Comutação 


5 10 15 20 o) 5 10 15 20 
tis] tis] 


Figura 8.12: Utilização da realimentação tacométrica para eliminação da os- 
cilação sustentada, porém agora com a manifestação de um movimento desli- 
zante. 


Relembrando o conceito de inclinação da trajetória, m, tem-se nesse problema 
que 


u 

=> — 8.92 

m a ( ) 
5 

= cs 8.93 

- (8.93) 


para o caso de o relé estar com cinco unidades e evoluindo no semiplano infe- 
rior, próximo à região em que ocorre o chaveamento. 


Na iminência de atravessar a reta de comutação, a inclinação m pode estar 


maior que L, 
Como os relés reais não comutam instantaneamente, é plausível assumir que 


a trajetória atravesse infinitesimalmente a reta de comutação. 


Imediatamente, a trajetória tentará seguir a inclinação —m que fará retornar 
ao lado da reta de comutação de onde havia vindo. Ou seja, ocorrerá uma 
sequência de comutações sucessivas rápidas. No caso ideal em que os chavea- 
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mentos ocorrem instantaneamente, não se perceberia o ziguezagueamento da 
trajetória, ou o fenômeno denominado de chattering. O movimento que resulta 
é denominado de escorregamento (ou sliding motion). 

É interessante notar que, a menos do chattering, a trajetória acompanha uma 
reta que passa pela origem, e, portanto, o processo evolui como um sistema 
linear com autovalor real negativo. 


O movimento deslizante apresenta propriedades interessantes em algumas apli- 
cações práticas e será tratado mais adiante. 


8.3.5 Relés não ideais 


Neste texto, relés não ideais são aqueles que apresentam retardo no chavea- 
mento, faixas de entradas para as quais o dispositivo não responde, diferença 
de valores de entrada para o chaveamento para um estado ou outro etc. 


E importante ressaltar que não necessariamente essas características são inde- 
sejadas. 

Aqui são estudadas duas características bastante comuns de dispositivos liga- 
desliga: zona morta e histerese. A figura 8.13 apresenta o caso de relé com 
zona morta. 


Y(s) 


s(s+1) 


Figura 8.13: Relés com zona morta e histerese. 


A existência de zona morta significa que valores de e(t) nessa faixa não pro- 
duzem ações de controle u(t), significando que pode ocorrer erro de regime. 


Por outro lado, muitos sistemas físicos apresentam esse fenômeno. 


A figura 8.14 apresenta o caso de relé com histerese que é um fenômeno muito 
visto em materiais magnéticos. 


10 
R(s) = a + E(s) Y(s) 


s(s+1) 


Figura 8.14: Relés com zona morta e histerese. 


Métodos no domínio transformado 243 


Através de simulações digitais foram obtidos os esboços de plano de fase apre- 
sentados na figura 8.15. Na parte esquerda da figura observa-se o plano de 
fase com relé que apresenta uma região (no caso [—1,1]) em que a saída é 
nula. Mais especificamente, se —1 < e(t) < 1 ou —1 < r(t)—y(t) < lla 
saída do relé é 0. Assim, se a trajetória chega a um ponto (21,0), então ficará 
definitivamente com y = £1, já que y = x2 = 0. Ou seja, haverá erro de regime 
permanente. 


G(s)=1/(S2+s), rele=[-5,5], zona morta[-0.75,0.75] o G(s)=1/(s?#s), tele=[-5,5], histerese[-1,1] 


T 
1 
l 
l 
l 


T 
! 
I 
1 
1 
1 
[j 
1 
] 
1 
1 
1 


y-dot 
y-dot 


Erro de 
Regime 


Figura 8.15: Efeitos comuns devidos a zona morta e histerese de estruturas de 
controle liga-desliga. 


No caso do relé com histerese, há um certo atraso na comutação, de modo que 
é comum que ocorram oscilações sustentadas. 


Se a trajetória fechada é alcançada com a condição inicial no seu interior, ou 
fora dele, diz que se trata de um ciclo limite estável. 

Nesse problema exemplo, ocorre o fenômeno de ciclo limite estável, e o sistema 
apresenta oscilações em torno do valor de referência desejado de 10. 

No Apêndice G é apresentado um método de análise aproximado (método 
da linearização harmônica, da função descritiva, da primeira harmônica) que 
permite estimar a amplitude e a frequência de oscilação, caso esse fenômeno 
ocorra, para sistemas LTI acionados por não linearidades estáticas. 


8.3.6 Ação assíncrona (dither) 

Um fenômeno muito interessante e por vezes útil na prática é a ação assíncrona 
(dither). 

A ação assíncrona é obtida por uma adição de um sinal de frequência elevada 
na entrada de relés, podendo alterar a sua característica de modo favorável. 


No exemplo apresentado aqui, o comportamento de um relé será modificado 
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como se fosse um ganho linear. Além disso, o ganho será ajustável através 
da manipulação da amplitude do sinal de dither tipo triangular de frequência 
muito elevada que é utilizado. 

Considere a seguinte malha de controle em que a o sinal d é periódico de 
frequência muito maior do que os modos do modelo, considerado ser d = 
triang(t) de período T e amplitude D no exemplo considerado. 


Figura 8.16: Injeção de um sinal de dither na entrada de um elemento não 


linear 
A figura 8.17 mostra u(t) para três valores diferentes de e(t): Como a 


4 etd 


Mł 


Figura 8.17: Cálculo da média do sinal de entrada e com o dither d adicionado. 


frequência do sinal d é muito elevada, o sistema G(s) responderá apenas à 


média do sinal. 
Usando a semelhança de triângulos, tem-se a seguinte regra de três: 


T 

T D :: tm: DHE (8.94) 
T 

7 Lpi toff : D- E (8.95) 
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em que o valor médio < u > de u(t) é obtido por 


1 T 
i e I u(t)dt (8.96) 

T Jo 
1 ton T 

nr | M dt — uai (8.97) 
T Jo löi 
1MT|D+E D-E 

= 7 D D | (8.98) 
M 

= DE 
(8.99) 


Logo, u(t) = Melt) para E < D e se D > E o sinal estará saturado. Ou seja, 
pela utilização do dither, o relé ideal foi transformado em um ganho linear 
com saturação. 


Sugere-se investigar o que acontece quando o dither é do tipo senoidal ou 
quadrado. 


Modelos de primeira e segunda ordem atuados por não linearidades estáticas 
simples como relés, atrito seco, folga de engrenagem e amplificadores com 
saturação podem ser estudados de modo fácil utilizando métodos gráficos, 
como o plano de fase. Uma vez que se esboça o plano de fase, é muitas 
vezes possível obter resultados quantitativos, já que o modelo matemático é 
conhecido. 


8.4 Controladores no domínio transformado 


Muitos sistemas práticos admitem modelos lineares invariantes no tempo (LTI) 
e podem ser tratados com o auxílio da transformada de Laplace, na forma de 
funções de transferência. 


Nesta seção, a ideia é focar predominantemente o projeto de controladores 
para processos em que a função de transferência possui apenas uma entrada e 
uma saída (SISO). 

Em particular é assumida a seguinte estrutura da malha de controle 


O processo a ser controlado é modelado por Gp(s) e o controlador principal, 
objeto de atenção na maior parte deste capítulo para efeito de projeto, é re- 
presentado por Gc(s). 


A função de transferência Grpr(s) representa um bloco chamado de controla- 
dor antecipativo ou feed forward. 
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Feed Forward 


V(s) 


Pré-Filtro 


je 


Figura 8.18: Estrutura típica de uma malha clássica de controle. 


Desde que Gpp(s) seja estável, não há impactos na estabilidade da malha de 
controle e a ideia é melhorar o desempenho do sistema de controle “anteci- 
pando”a informação sobre r(t). 


A função de transferência Gpr(s) é um pré-filtro (ou filtro condicionador, 
filtro pré-compensador ou outras denominações) que pode limitar a taxa de 
variação do sinal r(t), eliminar ruídos, normalizar as referências, entre outras 
possibilidades. 


Tendo-se em perspectiva a utilização de arquiteturas de controle em malha 
fechada, necessita-se de uma ferramenta que permita avaliar as características 
da função de transferência de malha fechada Gmp(s) partir do conhecimento 
da função de transferência de malha aberta Gma(s), 


Gma(s) = Go(s)Gp(s) (8.100) 
Através de manipulações algébricas elementares, verifica-se que 


Gmr(s) = ee (8.101) 


Quando for óbvio pelo contexto, os subscritos MA e MF nao serão utilizados 
na caracterização de G(s). 


Observação: Em problemas de regulação em ambientes industriais a referência 
R(s) recebe o nome de Set Point (SP) e a saída de Process Variable (PV). A 
entrada do processo U(s) é referida como a Manipulated Variable (MV). 


O controle de modelos SISO-LTI é tratado didaticamente em vários excelen- 
tes livros-texto, como (OGATA, 1970; DORF; BISHOP, 1995; FRANKLIN; 
POWELL; EMAMENAEINI, 1986; KUO, 1980) e (VEGTE, 1990), entre ou- 
tros. 
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8.4.1 Tipos de funções de transferências do processo 


Uma característica importante de um sistema de controle é o erro em regime 
permanente (t — oo) para determinados sinais de referência. 


Para investigar a qualidade da regulação, é interessante verificar o erro em 
regime para uma excitação tipo degrau, e, para investigar o erro de rastre- 
amento, é interessante verificar o erro em regime para uma excitação tipo 
rampa. 


Considere uma função de transferência de malha aberta, G(s) = Gp(s)Gc(s) 
(s — 21)... (S — 2m) 


G(s) =K- ES (8.102) 


em que z; (zeros) e pj (polos) são não nulos para Vi, j. 


O sistema é dito ser do tipo 0 seg = 0 e do tipo 1 seq = 1. 


Caso de entrada degrau 


Observando-se a figura 8.19, tem-se que o si- 


nal de erro e(t) é tal que Els y 
l R(s) + o (s) (s) 
E(s) = —— — R(s) (8.103) 


1+ G(s) 


O teorema do valor final permite a determi- Figura 8.19: Uma estrutura de 
nação de f(t) para t + oo a partir da sua Controle padrão com realimen- 
transformada de Laplace através da fórmula tação negativa unitária. 


f (00) = lim sF(s) (8.104) 


Ou seja, o erro em regime apresentado por um modelo para uma entrada 
degrau (R(s) = 1/s) pode ser obtido por 


. 1 1 
de modo que, para sistemas do tipo 0, 
1 
= > .1 
e (co) TEC) (8.106) 
1 
= 8.107) 
(—21)...(—zm) ( 

Le doen) 


Logo, sistemas do tipo 0 apresentam erro de regime nao nulo para entrada 
degrau, mas que é reduzido à medida que o ganho K é aumentado. 
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Para eliminar o problema do erro de regime é comum que se busque inserir um 
integrador na malha (ou seja, um polo da função de transferência na origem). 


De fato, para sistemas do tipo 1, tem-se a resposta degrau com erro de regime 
nulo 


1 1 
= hj = Al 
ae) so EGGS ($108) 
. 1 
= m LK (=21).-(—2m) (8.109) 
PO s(=p1)...(—pm) 
= 0 (8.110) 


Caso de entrada rampa 
Empregando-se o teorema do valor final, o erro em regime a uma entrada 
degrau (R(s) = 1/s?) pode ser obtido da expressão 
(et ae (8.111) 
oy ~ s50 1+G(s) 82 ` 


de modo que, para sistemas do tipo 0, 


e(oo) = Co. (8.112) 
= 00 (8.113) 


Logo, sistemas do tipo O apresentam erros crescentes de rastreamento, à me- 
dida que t > oo. 


Para sistemas do tipo 1, tem-se 


: 1 1 
e(oo) = lim 475 Gis) of (8.114) 
= Via E : (8.115) 


s i (—21)...(—zm) 
ed a 
1 


EE) (8.116) 


(=p1)..(-pm) 


de modo que o erro de rastreamento é finito e reduzido se K é elevado. 
É comum que se defina 
K, = limsG(s) (8.117) 
s>0 
—2z1)...(—Zm) 


- x! 


EDER ee 
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denominada de constante de velocidade e que se relaciona com e (00) através 
de 


e(00) = — (8.119) 


A tabela a seguir apresenta, de modo sucinto, os principais valores de erros 
em regime e(00): 


Tipo | Degrau | Rampa 
T 
0 | oo 00 
1 0 E 


8.4.2 Princípio do modelo interno 


Considere a malha de controle da figura 8.20 


Figura 8.20: Princípio do modelo interno. 


em que 
_ No 


. _ Np 
mn 


_ Nr 
5: 


Go(s) = Dr 


Gp(s) R(s) (8.120) 


O objetivo é projetar Go de modo que e(t) — 0 à medida que t > co. 
Imediatamente a partir da figura 8.20 e de 8.120, obtém-se que 


1 
His) = 1+ Gp(s)Gals) R(s) (8.121) 
= Dp(s)Do(s) Np(s) 
=" Dae ots) 4 NEGO Da) ete?) 


Para que e(co) = 0, a malha fechada deve ser estável (raízes de Dp(s)Do(s)+ 
Np(s)Nc(s) = 0 no SPE) e Dr(s) deve ser um fator de Dp(s)Dc(s). 


Ou seja, deve existir Q(s) de modo que 


Dp(s)De(s) = Q(s)Dr(s) (8.123) 
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Nessas condições, 


Rap ee 
Es Dp(s)Dc(s) Nr(s) 
s>0 Dp(s)De s) T Np(s)Nc(s) Dr(s) 
no Qs) : 
> Ee aE) NON A 
or 


desde que 0 não seja raiz de Dp(s)Dc(s) + Np(s) No(s) = 0 


Exemplo 


Sejam dados o modelo do processo Gp(s) e a referência rampa R(s) 


s+2 1 
Gr(s) (s + 1)(s + 5) , R(s) 8 
e assuma que se deseja projetar 
_ Nels) 
Gc(s) Dc(s) 


que apresente erro de regime nulo. 


(8.124) 


(8.125) 


(8.126) 


(8.127) 


(8.128) 


(8.129) 


A condição “Dr(s) deve ser um fator de Dp(s)Dc(s)” é, no caso, “s deve ser 


um fator de (s + 1)(s + 5)Dc(s)”. 
Uma escolha conveniente é, portanto, Dc(s) = s. 


De fato, com essa escolha, 


(s+ 1)(s + 5)Do(s) 


e(co) 
(s+1)(s +5) s 


ah (s+1)(s + 5)De(s) + K(s + 2)Ne(s) 
= 0 


238° (e+ DG +5)Do(s) + K(s+2)Nols) 5 


(8.130) 


(8.131) 
(8.132) 


Logo, escolhendo-se Dc(s) = s e o conjunto Go(s)Gp(s) tornou-se do tipo 1 


e o controlador é um modelo interno análogo à entrada. 


8.5 Lugar geométrico das raízes (LGR) 


A estabilidade e também algumas características específicas de funções de 
transferência podem ser inferidas a partir do conhecimento da localização dos 
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seus polos. 


2 


Logo, para realizar projeto de controladores, é interessante dispor de uma 
ferramenta que permita visualizar os polos de Gmr(s) (malha fechada), a 
partir do conhecimento dos polos de Gma(s) (malha aberta) 
Gma(s) 

Gme(s) = EGO) (8.133) 
Uma ferramenta que possibilita tal facilidade é o lugar geométrico das raízes 
(LGR ou, em inglês, root locus). 
O traçado dos vários ramos do gráfico do LGR pode ser feito seguindo alguns 
passos simples. 
Embora o LGR possa ser traçado em função de diversos parâmetros, nesse 
texto foca-se apenas o caso da variação do ganho K € [0,00) de Gma = KG(s) 


N(s 
Gua(s) = cor (8.134) 
m m—l ... Ht 
s” + as" + +++ + an-s + Gn, 
"E a (Sa) 6) (8.136) 


(s — p1) +- (s — pi) -++ (8 — pn) 
Os passos para a confecção do LGR são: 


Passo 1: Marcar, no plano s, os polos (p;) com x e os zeros (zj) com o. 


Passo 2: Marcar o trecho do LGR contido no eixo real. Para K positivo, 
corresponde aos trechos com número ímpar de polos+zeros à direita. 


Passo 3: Desenhar as assíntotas que: 


a) Passam pelo ponto a, dado por 


1 n m 
Ore (Sn- Fs] (8.137) 


b) Possuem ângulos y;, dados por 


1 


Qi = (m—2kr) k=1,2,..,n-—m—1 (8.138) 


Passo 4: Calcular os ângulos de partida dos ramos “saindo” de polos pj, ou 
“chegando” a zeros zj, usando 


£pj = 5 4 (pj — pi) — X < (pj — zi) (8.139) 
i=1 ) 
ES 
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Passo 5: Determinar os pontos de cruzamento do LGR com o eixo imaginário 
utilizando o critério de Routh-Hurwitz. 

Passo 6 (opcional): Determinar os pontos de quebra (breakaway points) resol- 
vendo 


= 14 
T 0 (8.140) 


A verificação dessa condição é imediata, lembrando que nos pontos de quebra 
S = Sbp, à expressão A(s) = 0 possui raiz de multiplicidade 2. 


Ou seja, A(s) pode ser fatorada segundo 
A(s) = (s = Sbp) Aresto(58) 


Logo, pode-se escrever com o auxílio da regra da cadeia que 


Ee = 25 — sip) Aresto(s) + (8 — stp)? Z Arestols) (8.141) 


= Ûses= Spp (8.142) 


de modo que 24(s) se anula no ponto de quebra spp. 
ds p 


O resultado segue notando que o LGR só faz sentido se D(spp) £ 0 e 


= Ea + Soo (8.143) 
dA 1 N(s Dís 
ds D(s? 19) pis) N(s) ts) (8.144) 


OBS. 1: Os ramos “nascem nos polos” e “morrem nos zeros”. 


OBS. 2: Polos tendem a “repelir” e zeros tendem a “atrair” os ramos. 


Exemplo 


Considere a função de transferência de malha aberta, a ser operado em malha 
fechada com realimentação unitária negativa 


-K s? + 8s +25 

$$ + 10s4 + 3553 + 5052 + 245 
A figura 8.21 ilustra a aplicação dos passos para a construção do LGR em 
função do ganho K para o processo descrito pela função de transferência em 
8.145 

Passo 1: Os zeros são as raízes de s2 +8s +25 = 0, que são —4+ 73, e os polos 
são as raízes de sº + 108! + 358º + 50s? 4245 = 0, que são { 0, —1, —2, —3, —4 }. 


G(s) 


(8.145) 
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Passo 2: Marcar os intervalos [—1,0], [—3, —2] e (-00, —4]. 


Passo 3: Desenhar as assíntotas que passam por x5 >5(0-1-2-3-44444) ~ 
0.67. 

Passo 4: Obter o ângulo de chegada de um ramo no zero em —4 + j3 pela 
somatória com os sinais apropriados de <(—4 + j3 — pi) em que os pi são 
{0, —1, —2, —3, —4} ede £(—4+ j3 — (—4 — j3)) = 90º. No exemplo, o ângulo 
é de aproximadamente —60º. 


Passo 5: Obter o cruzamento dos ramos com o eixo imaginário. Para tal, 
lembrar que, em malha fechada, o denominador da função de transferência é 
dado por 


den(s) = s°+10s*+35s* + 50s? + 248+ K[s?+8s+25] (8.146) 
s5 + 10s* + 35s? + (K + 50)s? + (8K + 24)s + 25K(8.147) 
Através do critério de Routh Hurwitz, verifica-se que o limiar de estabilidade 
ocorre para K = 1.58 e corresponde a um par de polos imaginários puros em 
S = +91.071. 
Passo 6 Obter ss pontos de quebra dados por 


N(s) is) + D(s) Ei) = 0 (8.148) 


d 
(s? + 85+ 25) (8 + 10s* + 35s? + 50s? +245) + (8.149) 
S 


“(8 + 8s + 25)(s° + 108º + 35s? + 50s? + 24s) = O (8.150) 
S 
7s° + 108s° + 7005! + 2320s? + 3897s? + 2884s +600 = O (8.151) 


que resulta em s = —0.34 e s = —2.53. 


A figura 8.21 ilustra passo a passo os procedimentos utilizados para esboçar o 
LGR. 


8.5.1 LGR em função de zero ou polo 

O LGR pode também ser traçado para variações nos valores (posições) de um 
zero ou de um polo. 

Considere, por exemplo, a função de transferência de malha aberta 


s+a 


A a 
(s) s2+9s+ 16 


(8.152) 


em que o zero está na forma literal (a). 
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Passo1 Ima Passo2 Ima Passo 3 Ima 
o (e) (0) 
i 60° 
Re Re Re 
XX x oe | > —X—*x > ià 
Oo (e) (e) 
Re 
Passo4 Ima Passo 5 Ima Passo 6 Ima 
dt \ a LGR 
Re Re Re 
> —X— Xx > —K > 
(0) (o) 


Figura 8.21: Passos para esboçar manualmente um LGR. 


O denominador da função de transferência de malha fechada é dada por 


den(s) = s*+2s+16+5s+5a (8.153) 
= s*+7s+16+5a (8.154) 


Dividindo-se ambos os lados dessa equação por s* + 7s + 16, tem-se que 


2 
1 
den(s) _ 5 +7s+16 + 5a (8.155) 
s2 +7s +16 s2 +7s +16 
5a 
1+ = 8.156 
DESET ( 


Logo, os valores de s tais que den(s) = 0 podem ser buscados aplicando-se as 


regras do LGR a 


da 
DO us 8.157 
die s2 +7s+16 ( ) 


substituindo-se a = K. 


8.5.2 Ajuste de ganho usando LGR 


Um dos problemas básicos em um projeto de controladores é o de ajustar ga- 
nhos de malha. 

As regras para o traçado do lugar geométrico das raízes podem ser utilizadas 
para o ajuste de Kp em modelos como os da figura 8.22. 
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Figura 8.22: Controle proporcional ou ganho simples. 


Exemplo de ajuste de Kp 


Seja o problema de ajustar o ganho Kp em que Gp(s) é da forma 


s+3 
re + D(s + 2)(s + 4) 


Gp(s) = (8.158) 


de modo que o sobressinal seja Mp = 16.3 % (ou seja, € = 0.5 ou cos( 8) = 60º). 


Método grafico 


Na figura 8.23 vê-se o lugar geométrico de é constante (a reta com ângulo 5 
constante). 


Polos Dominantes 4 


O Polos de Malha Fechada 
XO Polos e Zeros de Malha Fechada 


Figura 8.23: Ajuste de ganho utilizando o LGR graficamente. 


A solução está marcada na figura 8.23 com um [O e se encontra no ponto de 
cruzamento de um ramo do LGR com o lugar de € = 0.5 


A determinação do valor numérico de Kp pode ser feita lembrando que, se um 
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ponto a pertence ao LGR, então 


= jGto)l (8.159) 
a+3 
1 K 8.160 
P a(a + (a + 2)(a + 4) een) 
4 
me lal |a+1||a+ 2| |a + 4| (8.161) 


la + 3| 
sendo que os diversos módulos (Jal, |a + 1|,|a + 2|, |a + 4], |a + 3|) podem ser 
medidos com o auxílio de uma régua. 


Havia, no passado, um instrumento próprio para o traçado de LGR, chamado 
de Spirule 


Figura 8.24: Instrumento Spirule para traçado gráfico de LGR. Imagem obtida 
de “History of Computing”, https: //www.nzeldes.com/HOC /Spirule.htm. 


Método algébrico 


Como o modelo do exemplo é de 4º ordem, a aproximação por polos dominan- 
tes requer que os dois polos não dominantes (pi e p2) estejam suficientemente 
afastados. 

Essa condição deverá ser verificada a posteriori. 

O denominador-alvo desejado para a função de transferência de malha fechada 
é da forma 


Dawo(s) = (s—pi)(s — po)(sº + 2Ewns + w?) (8.162) 
= (s-pi)(s— p2)(s* + lwns + w2) (8.163) 

sf + (wn — pı — p2)s® + (w3 — (pi + p2)wn + pip2)s” 
+(Wnpip2 — we (pı + p2))s + wi pipa (8.164) 


Por outro lado, o denominador de E é dado por 


Due(s) = s1+7s?+ 14s? + (8+ Kp)s+3Kp (8.165) 
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Igualando-se os coeficientes de Daiyo(s) e Dur(s), tem-se que 


7 = n-p- p (8.166) 
14 = wi (pi + p2)wn + pipe (8.167) 
8+Kp = wnpipo— wn(pi + p2) (8.168) 
3Kp = wrpipo (8.169) 
cuja solução é 
Kp = 1.496 (8.170) 
Wn = 0.703 (8.171) 
pı = 4.062 (8.172) 
p2 = 2.235 (8.173) 


Como w, << pi o método dos polos dominantes fornece uma solução satis- 
fatória. 


8.5.3 Ajuste da realimentação tacométrica usando LGR 


Em muitos problemas práticos, é possível medir diretamente a derivada do 
sinal de saída usando um instrumento apropriado, como tacômetros e girôme- 
tros. 


Nesses casos, é possível utilizar a informação, por exemplo, da velocidade de 
rotação de um motor, sem derivar o sinal de saída. 


O procedimento de derivar qualquer sinal não é recomendado, pois tende a 
exacerbar o ruído. 


Uma solução seria utilizar estimadores de estado, um tema a ser tratado adi- 
ante, porém incorrendo em custos computacionais adicionais. 

Exemplo de utilização da realimentação tacométrica 

Considere um processo modelado por Gp(s) da forma 


K s+3 

Pas + D(s + 2)(s + 4) 
e suponha que se quer ter, em malha fechada, um sobressinal de Mp = 16.3% 
e tempo de subida t, = 2.42 s. 


Gp(s) = (8.174) 


Com o ajuste somente de Kp nao será possível atender às duas especificações 
simultaneamente, pois para ajustar duas características são necessários dois 
graus de liberdade. 
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Assim, introduz-se um zero na posição —À correspondente à realimentação 
tacométrica para que, juntamente com o Kp, tenha-se dois graus de liberdade 
para ajustar Mp e tr. 


Incluindo o efeito da realimentação tacométrica, a nova função de transferência 
de malha aberta é dada por 


s+3 
s(s+ 1)(s+ 2)(s + 4) 


Cueio) = Ke (Ass) (8.175) 


Método gráfico 


A posição do zero em —1/A deve ser ajustado de modo que um ramo do 
LGR passe pela posição alvo de malha fechada (intersecção entre as curvas de 
E = 0.5 e wn =1rad/s). 


Como é e wn são conhecidos, é possível marcar a posição do par de polos dese- 
jados de malha fechada, dados por p12 = —wn cos( 8) + jwn sin( 8), lembrando 
que 8 = cos !(£) (no presente caso, 60º). 


Uma vez que os ramos do LGR estão passando pelo polo desejado, basta obter 
o ganho Kp pelo mesmo método utilizado anteriormente. 


Im[s] 


Zero introduzido 
pela realimentação 
tacom étrica 


Polos 


O Polos de Malha Fechada a 
Dominantes 


XO Polos e Zeros de Malha Fechada ' 


Figura 8.25: Malha de controle em que se utiliza a realimentação tacométrica. 


Pelo método gráfico, conforme a figura 8.25, uma solução é Kp = 2.7 e À = 0.4. 
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Método algébrico 
Considerando as especificações € = 0.5 e wn = 1, o denominador-alvo é 
Dawo(s) = (s—pi)ls— p2)(s” + 26Wns + wh) ( 
= (s—pi)(s—pe)(s?+1s+1) ( 
st + (1—pi — p2)s? + (pipe — p2 — pı + 1)s? (8.178 
+(p1P2 — p2 — p1)S + pipe ( 


O denominador da malha fechada ee - é dado por 
Dur(s) = s*+7s?+(KpA+14)s? + (8.180) 
+(Kp(3\ + 1) + 8)s+3Kp (8.181) 


Igualando-se os coeficientes de Dalvo € Dmr, obtém-se que 


7 = 1-p -p (8.182) 
KprX\4+14 = pıp2— pə— pı +1 (8.183) 
Kp(3A +1) +8) = pipo -p-p (8.184) 
3Kp = pipe (8.185) 
cuja solucao é 
Kp = 2.714 (8.186) 
A = 0.421 — corresponde a zero em 2.37 (8.187) 
pı = —3.926 (8.188) 
po = —2.074 (8.189) 


O lugar geométrico das raízes é uma ferramenta muito útil que permite 
visualizar as dificuldades potenciais no projeto de controladores, bem como 
para sugerir propostas de possíveis estruturas para o controlador. Além 
disso, permite a imediata verificação da existência de zeros em localizações 
inconvenientes ou o grau de dominância de um par de polos complexos. 


8.6 Controlador PID 


O representante mais comumente encontrado de controlador com a estrutura 
da figura 8.18 é o Proporcional+Integral+Derivativo (PID), caracterizado por 


de 


u(t) = Kpe(t) + Ky IR e(r)dr + Kp 7 (t) (8.190) 


260 Engenharia de controle 


ou 


alt) = kp Q + E | e(T)dr + (0) (8.191) 


1 


em que Kp, Kr e Kp são os ganhos proporcional, integral e derivativo, res- 
pectivamente. O Ty é o tempo integral (ou 1/T; o número de repetição por 
segundo) e Tp é o tempo derivativo. 

Por vezes, limita-se o ganho segundo 


Umax 3 kpe > Umax 
u(t)= 4 kpe 3 Umin < kpe < Umax (8.192) 


Umin ; kpe < Umas 


caso em que é interessante introduzir o conceito 
de banda proporcional (BP), definido como 


BP = emaz — emin (8.193) 
Figura 8.26: Fenômeno da 


Imediatamente da figura, constata-se que, saturação 
quanto menor o percentual de BP for a faixa de 
excursão do sinal e(t), maior o ganho. 
Logo, uma forma efetiva de especificar kp é como o inverso de PB em porcen- 


tos, 
1 


~ PB(x100%) 


Aplicando-se a transformada de Laplace na expressão do controlador PID em 
8.190, tem-se que 


kp (8.194) 


1 
ni = (Kp + KZ + Kos) E(s) (8.195) 
Kp? +K K 
T a (8.196) 
Ss 
ee mamm 
Go(s) 


Como o grau do numerador em 8.196 é maior que o do denominador, a fun- 
ção de transferência de E(s) para U(s), em 8.196 não é realizável. Assim, 
usualmente é utilizada a forma 


G (s) o Kps2 + Kps+ Ky 
E s(s +a) 


(8.197) 


em que o parâmetro a é escolhido de modo a não afetar o transitório, ou seja 
|a| > |Re [Ail|, em que A; são os polos do sistema em malha fechada. Em 
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outras palavras, a é um polo afastado de Gco(s)P(s). 


À expressão para o controlador PID vista em 8.197 é dita ser de forma paralela 
e será aqui adotada pela conveniência de notação, lembrando que uma forma 
pode ser convertida em outra de modo simples. A figura 8.27b apresenta o 
diagrama de blocos da forma paralela (a) e a padrão (b). 


Figura 8.27: Duas representações diferentes para o controlador PID. 


Os ajustes dos parâmetros kp, ki e kg (ou de Kp,T;,Tp) dependem das espe- 
cificações de desempenho e podem ser baseados em métodos variados. 


Controlador I-PD 


Quando o sinal de referência r(t) apresenta variações bruscas, o termo D do 
controlador PID tende a gerar picos grandes que, eventualmente saturam o 
atuador. 


Um esquema para atenuar esse problema é utilizar o termo derivativo no ramo 
de realimentação, conforme ilustrado na figura 8.28. Utilizando-se o esquema 


y 


Figura 8.28: Controlador I-PD. 
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PD, tem-se que 


kp G(s) 
e e (8.198) 
R 1+ kp (1+ zh + Tps) G(s) 
1 kp (1 + z + Tps) G(s) 
= pta ) (8.199) 


LT + Tb ja kp (1 + Ts + Tps) G(s) 


que é equivalente a utilizar um pré-filtro combinado com um controlador PID 
usual. 


Diagramas e símbolos utilizados em controle de processos 


No meio industrial, em que se tem processos complexos com várias malhas de 
controle, é usual usar uma representação padronizada (por exemplo, ABNT/NBR 
8190 e ISA 5.1). 


A figura 8.29 ilustra um exemplo muito simples de trocador de calor, em que 
TIC significa Temperature-Indicator-Controller, FT é o Flow Transmiter e os 
números na parte inferior do círculo são uma identificação da malha de con- 
trole. 


j! a Entrada 


~ p do Fluido 
WV\ 7 
100, a 
aa 401, 
Vapor = > mio r N 
b f FE 
Not EN 
| a 4 é 
Vapor dt MN Saida 
k oe” ™ do Fluido 
i - Placa de Válvula 
wands L Orificio 
álvula L$ 
Manual 4 
Resíduos 


Figura 8.29: Exemplo de um diagrama de instrumentação de controle. 


Outros exemplos de simbologia são TRC (Temperature Recorder Controller), 
FAL (Flow Alarm Low), LAH (Level Alarm High), SIC (Speed Indicator Con- 
troller) e PT (Pressure Transmitter). 
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8.6.1 Sintonizagao de PID com LGR 


Como exemplo, considere um processo descrito pela função de transferência 


_ Ys) 
Ge(s) = Tis) (8.200) 
e (8.201) 

(s+2)(s+3) 
a ser controlado por 

Gols) = = ou (8.202) 
U(s) = Gols) (R(s) — ¥(s)) (8.203) 
= (Kp + Ky + Kps) E(s) (8.204) 
a, Ao eG (8.205) 
Kps? + Kps+ Ky (8.206) 


s(s +a) 


em que a é um polo distante inserido artificialmente para tornar 8.205 reali- 
zável. 


Assuma que as especificações de desempenho são € = 0.5(Mp = 16.3%) e 
Wn = 2 rad/s (t, = 1,28). 

Uma vez que se dispõe de três parâmetros (Kp, Kr, Kp) e de apenas duas 
especificações, pode existir mais de uma solução. 

Cono o numerador do PID é um polinômio de 2° grau, pode-se optar por ter 
dois zeros reais ou um par de zeros complexos conjugados. 

A figura 8.30 apresenta duas dessas soluções, ambas satisfazendo as especi- 
ficações de desempenho propostas. Porém é possível que uma solução seja 
superior à outra, segundo algum critério adicional. 

Os controladores projetados são 


s? + 9.75s + 22.5) 


Gal) = 56 sao (8.207) 
s? +8s +18 


sendo que Gc, aloca os zeros em —6 e —3.75, enquanto Gcz aloca os zeros 
complexos conjugados em —4 + 51.4. 
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O Polos de Malha Fechada 
XO Polos e Zeros do PID Dominantes 
X Polos do Processo 


& = 0.5 (Mp=16.3%) 


Qn = 2 (t=1.2s) 


O Polos de Malha Fechada Polos 
XO Polos e Zeros do PID Dominantes 
X Polos do Processo 


Figura 8.30: Ajuste de controlador PID utilizando LGR. 


8.6.2 Método de Ziegler-Nichols 


Trata-se de um método heurístico que tem resultado em comportamentos sa- 
tisfatórios em várias aplicações práticas. 
Há dois procedimentos principais para aplicação do método de Ziegler-Nichols 
(Ziegler, J.G. e Nichols, N.B.. Optimum settings for automatic controllers. 
Trans. ASME, v. 64, p. 759-768, 1942). 


1. Método da curva de reação: aplicável a processos chamados de autorre- 
gulados que são, na essência, BIBO estáveis. 


2. Método do limiar de oscilação: como o procedimento exige colocar o 
processo em uma condição de oscilação sustentada, o seu uso deve rea- 
lizado com cautela. Uma solução seria utilizar um relé para ocasionar a 
oscilação e utilizar o valor do ganho equivalente como o Kc. 
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Método da curva de reação 


Estando o controlador em modo de operação manual, aplica-se um degrau e, a 
partir da resposta, denominada de “curva de reação”, obtêm-se os parâmetros 
LeT (vide figura 8.31). 


A partir de T e L os ganhos Kp, Kr, Kp são obtidos diretamente de 


Curva de Reação Oscilação Limiar 


y(t) 0 + y(t) 
z -oE 
y(t) 


L T 


Figura 8.31: Parâmetros utilizados pelos métodos de Ziegler-Nichols. 


Controlador | Kp Kr Kp 
P T 
tr 
PI 0.97 aa 
PID 1.27 2L 0.5L 


Método do limiar de oscilação 


Estando o controlador em modo de operação automática, somente com o ga- 
nho proporcional Kp, este é ajustado de modo que o modelo apresente uma 
oscilação sustentada. 

O ganho Kp que corresponde a esta oscilação de amplitude constante é deno- 
tado Kc (ganho crítico) e o período Po. 


Nestas condições, os ganhos Kp, Kr, Kp são obtidos diretamente de 


Controlador Kp Ky Kp 
P 0.5Ko 
PI 045Kc SP 
PID 0.6Kc  05Pc 0.125Pc 


O método da curva de reação é aplicável a plantas que são assintoticamente 
estáveis para entradas tipo degrau, às vezes chamados de auto-regulados . 
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Uma forma de obter os parâmetros para sintonia de controlador PID pelo 
método do limiar da oscilação é ajustar o ganho proporcional para um valor 
muito elevado, de modo que se comporte como relé. Se houver oscilação, o seu 
período é associado a Po e a amplitude de oscilação Ac fornece 


4M 


Ko = — 
e TÃO 


(8.209) 


em vista do método da linearização harmônica (vide Apêndice G). 


O método de Ziegler-Nichols é particularmente eficaz no controle de plantas 
com modelos tipo primeira ordem com atraso 


Ke sT 
eo x. (8.210) 


8.6.3 Anti-windup 


O fenômeno de windup é um potencial problema encontrado na prática, ao se 
utilizar um integrador na malha de controle para eliminar o erro em regime 
permanente. 


Se o sinal de erro não for anulado por longo período, a sua integral assume 
valores muito elevados que tendem a saturar o atuador. Na figura 8.32 é visto 
um método para combate ao windup que consiste em calcular a diferença entre 
o valor do sinal solicitado V(s) e o valor de saturação de U(s) e adicioná-la na 
entrada do integrador. 


R(s) — E(s) 
+ 


Figura 8.32: Um mecanismo anti-windup para o controlador PID 


Uma outra técnica é interromper a integração no PID quando a saída do 
controlador atinge um limiar preestabelecido. 
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8.6.4 Regra do Lambda 


O ajuste de um controlador PI pela regra do lambda consiste em extrair alguns 
parâmetros da curva de reação e utilizá-los juntamente com fórmulas empíri- 
cas. 


Mais especificamente, dados K, Le T da curva de reação, o controlador PI é 
dado por 
1 t 
u(t) = Ke Q + zÍ ear) (8.211) 
Ti Jo 
em que 
T 
Ke = — 8.212 
i K (A+ L) ( ) 
T, = T (8.213) 


sendo o parâmetro de projeto A é escolhido na faixa de [T, 37]. 


Usualmente o tempo de acomodação resultante é da ordem de 4A. 


Mais detalhes em Dahlin, E. B. Designing and tuning digital controllers. Instr 
and Cont Syst, v. 41, n. 6, p. 77-84, 1968. 


Exemplo 


Considere um sistema em que a curva de reação apresenta K = 1, T=1 e 
L = 0.5, conforme a notação apresentada na figura 8.31. 


Nesse caso, conforme a tabela 8.6.2, o controlador PI é da forma 


es = KrE(S) (8.214) 
T 1IL 
= asd 1.67 (8.216) 


Se for utilizado o método do limiar de oscilação, o sistema apresenta, conforme 
a notação utilizada na figura 8.31, Po = 1.70 e Ko = 3.84. 


O controlador PI, segundo a tabela 8.6.2, é dado por 


U(s) = (Kp +K) E(s) (8.217) 
= (sxo + 7] E(s) (8.218) 
~ 1.73s + 1.42 (8.219) 


S 
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Usando a regra À com À = 2T e conforme a expressão 8.213, tem-se o contro- 
lador PI 


nt e zorg tr) E(s) (8.220) 
5 disto (8.221) 


As respostas degrau em malha fechada utilizando os controladores 8.216, 
8.219 e 8.221 estão apresentadas na figura 8.33. 


Ajuste de PID: Ziegler-Nichols e Regra Lambda 


<— Ziegler-Nichols — Curva de Reação 


Ziegler-Nichols — Limiar de Oscilação 


y 


Regra Lambda 


0 2 4 6 8 10 12 14 
Tempo [s] 


Figura 8.33: Respostas degrau, em malha fechada, utilizando controlado- 
res projetados pelas regras de Ziegler-Nichols e À. O processo é da forma 
Kae *S/(s + a). 


Nota-se da figura 8.33 que as regras de Ziegler-Nichols levaram a controladores 
com significativos sobressinais, enquanto a regra À resultou em um controlador 
com tempo de resposta maior. 


8.6.5 Aproximação de primeira ordem + atraso 


As regras de Ziegler-Nichols se adaptam bem a modelos da forma primeira 
ordem com atraso. Assim, apresenta-se a seguir um método para aproximar 
funções de transferência com atraso puro, zeros reais e polos reais por um 
modelo de primeira ordem com atraso. 
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Considere uma transferência G(s) dada por 


(ms+1)... (tims + 1) ou 


G(s) = K 8.222 
(s) (Tis +1)... (Tns + 1) ( ) 
e assuma que se deseja obter uma aproximação 
Gapron(8) = K l Ls (8.223) 
aprox rade G 
Lembrando que 
1 1 
ind do rem (8.224) 
podem ser consideradas as aproximações 
e ~ l-as (8.225) 
1 1 
Se = eee e 8.226 
e efs 148s ( ) 
ou 
e ~ —as+1 (8.227) 
1 
Ps = o 8.228 
E Bs+1 ( ) 


Utilizando-se as expressões 8.227 e 8.228, a função de transferência 8.222 pode 
ser aproximada notando que 


(ms + 1)... (ms + 1) “gs 


GU = (Tis + 1)... (Tns +1) (8.229) 


e"s., e mS e—728 | gens 


~ K ma 8.230 
ms+1 e ( ) 
= Ke i (8.231) 

Ts +1 

1 
_k -Ls 8.232 
aeri ( ) 
em que L= 0- Mm- Nmn TET < Ti, i= 2,3,...,0. 
n 


Um outro método para se obter uma aproximação para uma função de transfe- 
rência com polos e zeros reais é utilizar a regra da metade, também conhecida 


como regra de Skogestad (SKOGESTAD; POSTLETHWAITHE, 1996): 


e Ordenar as constantes de tempo em ordem crescente Ti > T2 >- > Tn- 
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e Metade da maior constante de tempo desprezado (72) é adicionada ao 
tempo de atraso de transporte (0). A outra metade é adicionada à 
constante de tempo a ser mantida (71). 


e Os termos an ea -ii caso existam, são aproximados por zaa = 
ents. n a 
e Os termos (ms +1),..., (mms + 1), caso existam, são aproximados por 
mel =e, 
Exemplo 
Considere o sistema descrito pela função de transferência 
at= (—0.1s + 1) (8.233) 
3) = ; 
É (5s + 1) (3s + 1) (0.55 +1) 
Pelo método representado pela expressao 8.232, 
1 
G ~ K —0.1s —3s —0.5s 8.234 
1(8) 5s+1 i as ( ) 
1 
= Ke 4% 8.235 
os+1 E ( ) 


Pelo método da metade, as constantes de tempo são 5 > 3 > 0.5. A maior 
constante de tempo a ser mantida é 5. A maior constante de tempo a ser 
desprezada é 3. Logo, a metade, 1.5 = 3/2, é adicionada ao atraso puro, ou 
seja, e7255, e a outra metade é acrescentada ao maior constante de tempo 5, 
resultando 5 + 1.5 = 6.5. 


O termo (—0.1s + 1) é substituído por e-!ls e o termo OBST por eo 
Juntando todos os elementos, tem-se a aproximação 
1 
Gals) = kma A (8.236) 
1 
E ey E (8.237) 


A figura 8.34 apresenta as respostas degrau das funções de transferência Go, 
Gi e Go. 


Controladores PID sao muito populares e, quando bem sintonizados, apre- 
sentam bom desempenho. Sao relativamente baratos e facilmente encontra- 
dos no mercado. Além disso, cada um dos termos P, I ou D possui ações 
intuitivas que permitem ter uma compreensão intuitiva do comportamento 
da malha de controle. 
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Aproximação de Modelos 


|- Modelo Original 
[=-= Método 1 
[=== Método 2 


0 5 10 15 20 25 30 35 40 
Tempo [s] 


Figura 8.34: Comparação entre as respostas degrau da função de transferência 
original (linha sólida), aproximação por série de Taylor truncado de primeira 
ordem (linha pontilhada) e aproximação pela regra da metade (linha trace- 
jada). 


8.7 Escalonamento de ganhos 


O método de escalonamento de ganhos (gain scheduling) apresentado aqui 
consiste em ajustar os parâmetros de controladores simples, de acordo com o 
estado em que o processo se encontra na região de operação (ou envelope de 
operação). 

Usualmente os controladores simples são projetados usando modelos lineari- 
zados cuja validade se restringe a sub-regiões específicas e, à medida que o 
processo evolui, passando de uma sub-região de operação a outra, os parâme- 
tros devem ser reajustados, com o intuito de se manter boas características de 
desempenho. 


Conforme visto anteriormente, dado um sistema descrito pela EDO da forma 
x = f(x,u) (8.238) 


um modelo linearizado na vizinhança do ponto de equilíbrio xp que corres- 
ponde a uma entrada u(t) = ug constante é dado por 


Ax ~ A (xg, T) Ax + B(xp, ug) Au (8.239) 
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em que (Au, Ax} são as pequenas perturbações e as matrizes jacobianas A e 
B são dadas por 


oh. ve oh. gi. bush ph 

Fi En UL Um 

Add Co ss Bs Lc: (8.240) 
OF. o Əfn Om. In 
da Otn (xp,up) Out dum Gaus) 


A região de operação no espaço de estados é dividida em várias sub-regiões, 
cada uma caracterizada por um par (xz, Ug). 


Cada sub-região deve ser suficientemente pequena para que o controlador local, 
projetado usando o modelo linearizado, possua um desempenho adequado. 


São projetados controladores para cada uma dessas sub-regiões. 


À medida que o estado x evolui de uma sub-região para outra, ajusta-se o 
parâmetro do controlador segundo algum mecanismo de adaptação. 


Um mecanismo simples de adaptação é fazer uma interpolação linear. 


Se ao redor da sub-região caracterizada por (xg1,Ug1) o controlador possui 
parâmetros 04 e ao redor de (xg2,Ug2) o controlador possui parâmetros 02, 
faz-se 

0 = A01 + (1 — »)02 (8.241) 


sendo À a distância normalizada do estado atual x a partir de (xg; ao longo 
da linha xp; > xz). 


Ao invés de uma teoria geral, o método de escalonamento de ganhos será 
apresentado na forma de um exemplo. 


Considere, então, um modelo de processo massa+mola+amortecedor em que 
a mola possui característica cúbica, descrito por 


i+ by + (kıy + koy?) = u (8.242) 


Fazendo-se a associação ©] = y e £2 = 1, tem-se que 


(8.243) 


TI = T2 
T2 = kızı kax? bas + u 


Denotando (zxzı)g o primeiro componente do estado xz, o modelo linearizado 
é caracterizado por 


0 1 0 
a Lata 2] :B=[2] ew 
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ou 


. 0 1 0 
Ax= eee, os axe | 1 Jau (8.245) 
a = A Se 
A B 


Admitindo que será usada uma lei de controle do tipo realimentação de estados, 


Au = —KAx+ Ar (8.246) 


a dinâmica em malha fechada para pequenos sinais é dada pelos autovalores 
de 


0 1 0 
A-BK = | _ky — Bola? Sb | - | : | | Kı Ko | (8247) 
0 1 
= | h-dun -K —b— Ko | 2) 
cujo polinômio característico é 
Aa+BK(8) = 8° + (b+ K2) s + (kı + 3ka(x1)h + Kı) (8.249) 


Assumindo que as especificações de desempenho são: (i) sobressinal de 16,3% e 
(ii) tempo de subida de 1s, os valores requeridos dos parâmetros para o modelo 
segunda ordem são É = 0.5 e wn = 2.41. 


Logo, o polinômio característico desejado é 


Adesejado( S) = 3? + 2éwns + w (8.250) 
s? + 2.41s +5.81 (8.251) 


Comparando-se as expressões 8.249 e 8.251, conclui-se que K deve satisfazer 


b+Kə = 241 (8.252) 
ky + 3ho(11)2 + Kı 4.81 (8.253) 


Particularizando o exemplo para o caso kı = 1, kg = 2 e b = 1, e adotando-se 
3 pontos de equilíbrio, (xı)g = 0, 0.5 e 1, tem-se que as entradas constantes 
up requeridas são 


(ti)z | ug Kı Ko 

0 0.00 4.81 1.41 
0.5 0.75 3.31 1.41 
1 3.00 | —1.19 1.41 
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Segundo a tabela 8.7, os valores de Kı = 4.81 e Ko = 1.41 são utilizados na 
proximidade de (21) = 0, no caso, entre x; = —0.25 a 0.25. Na proximidade 
de (xı)g = 0.5, os valores dos ganhos sao Kı = 3.31 e Kə = 1.41, mais 
especificamente, utilizado entre xı = 0.25 a 0.75. Na proximidade de (x1)g = 
1, os valores dos ganhos são Kı = —1.19 e Kə = 1.41. 


A figura 8.35 apresenta em vermelho a resposta ao sinal “escada” traçado em 
verde, no caso com escalonamento. A resposta em azul é o caso sem o uso do 
escalonamento, utilizando-se somente os valores dos ganhos obtidos no ponto 


(11) B = 0. 


Comparação com/sem escalonamento de ganhos 


— com escalonamentd 
| mete sam escalonamento 
referências 


0 2 4 6 8 10 12 14 16 18 20 
tempo 


Figura 8.35: Comparação entre respostas com escalonamento (linha vermelha) 
e sem (linha azul). O sinal de referência é a de cor verde. 


8.8 Controladores cascata 


A ideia central da estrutura de controle cascata é controlar uma variável inter- 
mediária através de uma malha interna, visando melhorias quanto à rejeição 
de distúrbios e velocidade resposta. Eventualmente, efeitos de não linearida- 
des da malha externa podem ser reduzidos pela malha interna. 


A figura 8.36 apresenta, na parte superior, uma estrutura de controle de sim- 
ples malha e com uma variável v que tem o potencial de ser utilizado como 
saída de uma malha interna. 


Na parte inferior é mostrada a estrutura de controle cascada em que partici- 
pam, agora, dois controladores Goi(s) e Goo(s). 
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Usualmente Gci(s) é denominado de controlador mestre e Gca(s) de contro- 
lador escravo. 


D Variável Intermediária 


D 
E Ü; e! v Y 
Sa}; 


Malha Interna 


R E, U, 
ido Q 


Malha Externa 


Figura 8.36: Estruturas de controle cascata. 


Exemplo 


Como um exemplo prático, considere o processo de aquecimento contínuo de 
líquido, conforme esquematizado na figura 8.37, em que o fluxo de vapor v 
na serpentina pode ser tomado como a variável intermediária para efeito de 
controle cascata. 


Liquido a Liquido a 
ee = “C> a = 


==) Controlador 


Figura 8.37: Exemplo de controle cascata em um processo. 


Com o intuito de avaliar os desempenhos das estruturas de controle com res- 
peito à rejeição de distúrbios, propõe-se um estudo de casos em que 


1 
Gris) = 243542 vee 
1 
Gris) = 5 (8.255) 
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Projeto de Gc considerando a malha simples 


Assumindo que vai ser utilizado um controlador PI como G(s), 
1 
Gels) = (Kp + Kr) E(s) (8.256) 


tem-se, levando em conta o processo Gp(s) = Gpi(s)Gpa(s), que 


T(s) = = (8.257) 
= Gco(s)Gp(s) 
— 1+Go(s)Gp(s) so 
Kps+ Kr 


= 8.259 
s4 +883 +1782 + (10+ Kp)s+ Kr ( 
Adota-se como especificação de desempenho um sobressinal de 16.3% e tempo 
de subida de 2.4s que corresponde a se ter € = 0.5 e wn = 1 rd/s, caso valha 
a aproximação por polos dominantes. 


Deseja-se, portanto, que o denominador de T(s) seja idêntico a 


A(s) = (s+pi)(s+ po)(s? + 2Ewns + w2) (8.260) 
= (s+pi)(s+p2)(s* +s+1) (8.261) 

= sf 4+ (1+ pi + p2) s? + (1+ pı + p2 + pip) s? + 
+ (pı + p2 + pipa) s + pipe (8.262) 


ou, identificando os coeficientes de 8.259 e de 8.262, obtém-se o sistema de 4 
equações a 4 incógnitas 


lItm+p = 8 (8.263) 

L+ piper Pipe = 17 (8.264) 
pitpet+pip2 = 10+ Kp (8.265) 
pipa = Kr (8.266) 


cuja solução é pı = 5.3, po = 1.7, Kp = 6 e Kr = 9. Como €w,0.25, pı e po 
podem ser considerados suficientemente afastados para valer a aproximação 
por polos dominantes. 


Projeto de Go, e Gcz do esquema de controle cascata 


Projeta-se, inicialmente, o controlador Gogg da malha interna. O controlador 
escolhido é novamente do tipo PI, 8.256. Como a malha interna deve possuir 
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uma resposta mais rápida do que a externa, foram escolhidos € = 0.7 e wn = 
8 rd/s. A função de transferência de malha fechada da malha interna é dada 
por 


V(s) 
T; = 8.267 
int (8) Ui(s) ( ) 
Gp2G 
=. (8.268) 
1+ Gp2Gc2 
Kps+ Ky 
= 8.269 
s2 + (5+ Kp)s+ Kr ( ) 
cujo denominador deve ser idêntico a 
Als) = s*+ 2twns+w? (8.270) 
s? + 11.25 + 64 (8.271) 
Segue, imediatamente, que Kp = 11.2 — 5 = 6.2 e Kr = 64 e 
6.2s + 64 
T; = 272 
mls) = 211354 oe) 


Tendo-se o controlador Gcz da malha interna, pode-se projetar o controlador 
Gc, da malha externa. 

Como Gc escolheu-se novamente um controlador PI, 8.256 e foram mantidas 
as especificações de desempenho de sobressinal de 16.3% e tempo de subida 
de 2.4s. 


A função de transferência da malha externa é dada por 


_ Y(s) 
tts) = TO (8.273) 
_ _GeiTintGrr (8.274) 


1+ Go1TintGpi 
6.2K ps? + (64K p + 6.2K7) s + 64Kr 


= 8.275 
s5 + 14.251 + 99.659 + coe fos? + coe fis + 64K] ( ) 
em que 
coefg = 6.2Kp+ 2144 (8.276) 
coef, = 64Kp+6.2K; + 128 (8.277) 


Uma solução que atende as especificações estabelecidas, obtida com o auxílio 
de um computador digital, é Kp = 0.98 e Kk; = 1.8. 

A figura 8.38 apresenta o efeito da utilização de estrutura cascata em que se 
observa a sua superioridade em relação à rejeição de uma perturbação em v. 
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Comparação Sem/Com Controle Cascata 
E T T T T T 


1.27 


l 
I 


0 12 14 16 18 20 


Perturbação J 
-0.5 por 1s 


| 


0 2 + 6 8 10 12 14 16 18 20 
tempo [s] 


Figura 8.38: Gráfico que mostra o desempenho superior do controle em cascata 
na presença de distúrbios exógenos. 


8.9 Compensadores avançadores /atrasadores de fase 


Após um projeto inicial de um controlador, pode haver necessidade de se reali- 
zar compensações de efeitos decorrentes de procedimentos tais como desprezar 
o atraso na transmissão de dados, adotar modelos reduzidos, projetar con- 
siderando apenas os polos dominantes sem levar em conta os zeros e outras 
possibilidades. 


Uma possível solução é colocar em cascata com o controlador original filtros 
que realçam as frequências de interesse. 


Para melhorar o transitório, é interessante dispor de ganho elevado em altas 
frequências. 


Por outro lado, para reduzir o erro de regime permanente é interessante que o 
ganho seja elevado em baixas frequências. 


Esses filtros são chamados de compensadores cascata. 
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8.9.1 Projeto de compensadores avançadores de fase 


O compensador avançador de fase (lead), é um filtro passa-altas que é utili- 
zado para melhorar as características do regime transitório. 


Em baixas frequências, o seu ganho é unitário [0 dB], mas para altas frequên- 
cias fornece um aumento de ganho. 
Em termos de fase, reduz os atrasos, tendendo a melhorar a margem de fase. 


A função de transferência de um compensador avançador de fase é da forma 


geral 
Ts+1 


aTs+1 
A figura 8.39 apresenta as curvas de Bode para T =1,a=01eK=1, 
correspondendo a 


GLead = K ;0<a<l (8.278) 


s+1 
G Lead (8.279) 
5+1 
s+1 
= 10—— 8.280 
s+10 ( ) 


Compensador Avançador de Fase (Lead) 


So) 40 
[dB] 
0 
60 
T=1 
K=1 
ao 30 Sia a=0.1 


10° O 4 o! 
Frequency (rad/s) 


Figura 8.39: Curvas de Bode de um compensador avançador de fase (lead). 


O máximo avanço de fase ocorre para 


ER NEN (8.281) 
“CVYTor” Tya 
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e o seu valor é 


__1f1l-a 
Pmax = sin™! =) (8.282) 


Se for adequado aproximar o comportamento do sistema em estudo como sendo 
de segunda ordem, em torno das frequências de interesse, as especificações de 
desempenho requerem apenas o valor do sobressinal desejado (Mp) e do tempo 
de resposta, que tipicamente é o de subida (t,) ou o de acomodação (ts). 
Para modelos de segunda ordem (polos dominantes) e lembrando que tanto o 
sobressinal Mp quanto a margem de fase y dependem apenas do coeficiente de 
amortecimento é, basta ajustar o parâmetro a do compensador de modo que, 
na frequência de cruzamento de interesse (aproximadamente w, que resulta no 
tr ou ts desejado), tenha-se maz- 


Ajuste do compensador avançador de fase usando LGR 

Para sistemas de segunda ordem, tanto o Mp quanto a margem de fase y 

dependem somente do coeficiente de amortecimento é. 

A partir do Mp especificado, pode-se determinar o é requerido 
In(Mp)? 

T? + In(M,)? 


¿= (8.283) 


Dispondo de é, pode-se determinar a margem de fase y desejada usando 
1 26 
V1 + 4! — 28? 


Caso o projeto esteja sendo feito no plano s, ressalta-se que o lugar geométrico 
de € = cos(/3) corresponde a semirreta no plano s. 


(8.284) 


y=tan 


Por outro lado, t, e ts, juntamente com é, fornecem o valor de wp. 

De posse de € e wn, pode-se determinar o par de polos desejados (marcados 
com [O na figura 8.40). 

Tendo-se a posição dos polos desejados, basta encontrar Yı e 43 de modo que 
a somatória dos ângulos seja de — 180º. 


E interessante notar que o ângulo 0 = 1); — $3 é a contribuição a ser fornecida 
pelo compensador. 


No exemplo da figura 8.40, o processo não compensado é 


1 
G(s) = —— 8.285 
= (8.285) 
e as especificações de desempenho são tais que o sobressinal desejado é 16.3% 
e o tempo de subida é 0.6s. 
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Im{s} 


=} -3.46 j 


Polos 
Desejados 


Novo LGR ae | 


Figura 8.40: Exemplo de projeto de compensador avançador de fase usando o 
lugar geométrico das raízes. 


O sobressinal de 16.3% corresponde a € = 0.5 e o wn para tempo de subida de 
0.6s deve ser 4rad/s, levando em conta que é = 0.5. 


Escolhendo-se para o zero do compensador o valor —2, obtém-se 


(8.286) 


que resulta em um sobressinal significativamente maior. 

Uma recomendação crucial é, portanto, que se verifique se o projeto foi ade- 
quado, quer seja por simulação, teste com hardware in the loop ou no próprio 
processo. 

Tal necessidade é devido ao fato de que foram alocados os polos nos locais 
desejados, mas o efeito do zero não foi considerado. Como o zero não está 
suficientemente afastado, o seu efeito é significativo. 


Ajuste do Compensador Avançador de Fase usando as Curvas de Bode 


O projeto de um compensador avançador de fase para um processo Gp(s), 
utilizando a aproximação por polos dominantes e as curvas de Bode segue as 
seguintes etapas. 


1. Dada a especificação de M,, pode-se determinar o valor de € requerido. 
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2. A partir de € calcula-se y (margem de fase) usando 8.284. 
3. A partir de € e de t, (ou ts) especificado, determina-se wpn. 


4. Se o valor de € é pequeno, vale a aproximação wn = we = W|)\GGw)|=1" 
Considerando a aproximação wn ~ we, verifica-se qual Gmar deve ser 
adicionado ao £G p(jwe) + 180º para que se tenha a margem de fase y 
requerida. Na prática, convém adotar um valor de ¢maz ligeiramente 
maior para se ter uma margem de folga contra o efeito da inserção de 
zeros e polos do controlador no we. 


5. A partir de maz desejado determina-se a (equação 8.282). 


6. Adotando-se T = ae o compensador é dado por 
Ts+1 
G = kK ——__ 8.287 
o(s) = Ka (8.287) 


7. Ajusta-se, finalmente, K de modo que |Go(jwe)Gp(jwe)| = 1. 
A sequência de projeto de controladores avançadores de fase utilizando curvas 


de Bode encontra-se ilustrada na figura 8.41. 


G(je) | 
[dB] 


[4] Ajuste de K log(«) 
0 


A Gio) 
[°] 


log(m) 


—180 


Figura 8.41: Exemplo de projeto de compensador avançador de fase. 


8.9.2 Projeto de controladores atrasadores de fase 


O compensador atrasador de fase (lag) é utilizado, em geral, para aumentar o 
valor de K,, melhorando o rastreamento de referências tipo rampa. 
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Trata-se de um filtro passa-baixas e o seu projeto é muito simples. Ou seja, 
basta adicionar o ganho requerido em frequências mais baixas comparadas com 
aquelas da região de cruzamento da curva de ganho com o eixo OdB. 


A ideia é não alterar as curvas de Bode na região de frequências relevantes que 
caracterizam o comportamento transitório do sistema. 


IS(0)] 
[dB] A agio d 


x O 


Atrasador 


Figura 8.42: Exemplo de projeto de compensador atrasador de fase para me- 
lhoria do K,. 


8.9.3 Exemplo de projeto típico de controlador clássico 


O objetivo desta seção é apresentar um projeto simples à luz de especificações 
frequentemente utilizadas na prática. 


Considere um processo modelado pela função de transferência 


Gr(s) = ts) (8.288) 
1 
a (8.289) 


que deve satisfazer, em malha fechada com realimentação unitária, as seguintes 
especificações: 


1. e(co) = 0 para entrada degrau r(t) 
2. Mp = 16.3% (sobressinal) 
3. tr = 1s (tempo de subida) 


4. Ky = 10 
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em que e(t) = y(t) — r(t). 

Passo 1: Caso o modelo não apresente polo em s = 0, é interessante incluir 
um integrador da malha para se ter e(oo) = 0. No exemplo, como Gp(s) é do 
tipo 0, o controlador deverá incorporar o termo G(s) = L, 


Passo 2 Ajuste de Mp e t, mediante uso de compensador lead. 


Assumindo-se que será utilizado o conceito de polos dominantes, deve-se ter 
1. Mp = 20% > € = 0.5 


à ne e Do 2.42rad/s 


tr/1-E2 
Portanto, os polos de malha fechada devem estar localizados em Sgesejado = 
—Ewn E wnv'1 — E°, ou seja, —1.21 + 72.09. 


Um método é utilizar o LGR, conforme ilustrado na figura 8.43, em que se 


Im[s] Im[s] 
A Polos &=0.5 A 
dominantes 

desejados 


(-1.21+j2.09) 


Polos §=0.5 
dominantes 
desejados 
(-1.21+j2.09) 


Refs] 


-2.4 


©n=2.42 @n=2.42 


Figura 8.43: Exemplo de projeto utilizando LGR. 


realizaram dois projetos 


s+1 


= 587——— uD 
s+ 1.6 
= i. 291 


Um outro método para projetar o compensador lead é o algébrico. 


Para Mp = 16.3%, verifica-se que a margem de fase deve ser y = 52º, ou seja, 


a curva de Bode de fase deveria estar a — 180º + 52° = —128° para wn tal que 
IG1(jun)Gp(jon)| = 1. 
Porém £Gi(jwn)Gp(jwn) = —157°, de forma que, para chegar a —128º, é 


necessário somar 157 — 128 = 29°. 
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Para se ter uma margem de folga, escolhe-se 29º + 5º = 34º para maz, que 
leva a a = 0.28, T = 0.78, ou seja, 


0.78s +1 


= gge 8.292 

Gays 0.21s +1 ( 
s+1.3 

= 122 8.293 

s+47 ( 


Como mencionado anteriormente, em vista da utilização de métodos que en- 
volvem heurística, é necessário que seja feita pelo menos uma avaliação do 
projeto através de uma simulação ou, preferencialmente, investir em uma va- 
lidação junto ao processo físico propriamente dito. 


Passo 3 Ajuste do K, usando compensador lag. A constante de velocidade 
Ky, até esta etapa (processo+integrador+lead G»/5), é dada por 


K, = lim sGi(s)Go o(s)Gp(s) (8.294) 
s> 
17.07(s+16) 1 
= 8.295 
s (s+34) s+41 
= 48 (8.296) 


Logo, um possível compensador lag é um filtro passa-baixa nas proximidades 
de w ~ 0.1 com ganho de 10/3.3 = 3.0. 


Adotando-se ganho de 4, o compensador lag é dado por 


s+ 0.1 
G3 = —— 8.297 
° s4 0.033 een) 
O desempenho do controlador cascateando G1, G9/2,G3, pode ser visto na 
figura 8.44. 
Nota-se na figura 8.44 o efeito comparativo dos zeros introduzidos pelos com- 
pensadores Go, € G2/2- 


O compensador G»/3 supera o desempenho especificado, graças à significativa 
margem de folga na escolha de maz- 


8.9.4 Preditor de Smith 


O preditor de Smith é utilizado para controle de sistemas com atraso de trans- 
porte. 


Considere a tarefa de projetar um controlador Gc(s) para um processo com 
atraso Gp(s) = G(s) exp(—T's), conforme a figura 8.45. 

A ideia é projetar o controlador G x(s) como se não houvesse o atraso, ou seja, 
como se a planta fosse descrita apenas pelo fator G(s) (sem e~7*). 
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Comparação entre 2 projetos diferentes de compensador “lead” 


tempo [s] 


Figura 8.44: Comparação do desempenho do projeto do controlador com dois 
diferentes compensadores lead. 


Figura 8.45: Exemplo de uma planta que possui atraso de transporte. 


Quaisquer métodos podem ser utilizados para fazer o projeto do Gx(s). 
A saída correspondente será denotada Y (s). 


Nota-se, inicialmente, que 


Y(s) = G(s)U(s) (8.298) 
= G(s)U(s) + G(s)je TU(s) — G(s)e TSU(s) (8.299) 
= G()e FU()+(1-eTG()U(S) (8.300) 
Gp(s) 
= ¥(s)+(1—e-7*)G(s)U(s) (8.301) 


e, portanto, é possível obter §(t) a partir de y(t), requerido pelo controlador 
G'x(s), mediante o uso da parcela de predição (1 — e~?%)G(s)U(s). 


Esse termo é facilmente determinável, caso se conheça o modelo da planta. 


A estrutura do controlador Gg com o mecanismo de predição pode ser vista 
na figura 8.46. 
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Figura 8.46: Estrutura do controlador empregando o conceito de preditor de 
Smith. 


Na figura 8.46, verifica-se que 


U(s) = Gx(s)E(s) (8.302) 
E(s) = R(s)-Y(s) (8.303) 
Y(s) = Y(s)+(1—e7-7)G(s)U(s) (8.304) 
ou seja, 

U(s) = Gx(s) [R(s) — ¥(s) — (1 — e7™)G(s)U(s)| (8.305) 
E pre as Gay RU) — (s) (8.306) 

o Gx(s) 
— 14+ Gx(s)G(s) — Gx(s)e T'G(S) ES AO 

—— 4 


Gp 
Gx(s) 
1+ Gx(s)G(s) — Gx(s)Gpla) PS) 


O controlador baseado no preditor de Smith possui, portanto, a forma 


o Gx(s) 
~ 14+ Gx(s)G(s) — Gx(s)Gp(s) 


em que Gx foi projetado desconsiderando o atraso e TS. 


Y(s)] (8.308) 


Go(s) 


(8.309) 
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É importante ressaltar que o preditor de Smith depende da disponibilidade de 
um modelo acurado da planta para produzir bons resultados. 


8.10 Curvas de terceira ordem 


Assim como no caso de sistemas de segunda ordem os projetos podem ser 
baseados nos parâmetros é e wn, projetos de sistemas de terceira ordem nor- 
malizados na escala de tempo podem ser realizados empregando gráficos no 
plano. 


Os sistemas gerais de terceira ordem necessitam de três parâmetros, a1, a2 € 
a3 para a sua caracterização 


3 2 


dºy d'y dy 
| = ol 
18 +a 72 OH +azy=u (8.310) 


mas gráficos no plano permitem manipular apenas dois. 


Assim, fazendo-se a transformação 


t= 8.311 
= (8.311) 
tem-se que 
dy 3 zdy dy 
Yaga tuyaga taya +asy = u (8.312) 
dy a dy a2 dy 1 
+y = >u (8.313) 
dr?  Sasdr? s/ adr a3 
Sa a3 
Br ~~” 
Bo 
Essa transformação corresponde a uma mudança na escala de tempo. 
Os polos na nova escala de tempo 7 são obtidos de 
3 a 2, a2 _ 23 2 = 
i i as+1=s"+Bis+Bas+1 = O (8.314) 


ve (ya) 


Agora o modelo está parametrizado com dois valores 81 e (2 (ressaltando que 
a escala de tempo foi alterada). 


Utilizando o critério de Routh-Hurwitz, a condição para estabilidade é, no 
caso, 84 > 0, 2 > 0 e 8182 > 1, de modo que a região de interesse do plano 
11,82) é o primeiro quadrante ou, mais especificamente, acima da hipérbole 
descrita por 89 = ar. 
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Pode-se implementar um programa de computador que permita traçar o lugar 
geométrico dos pares (81, 82) tal que a percentagem de sobressinal é constante, 
como a vista na figura 8.47, por vezes referido como curvas de Vyshnegradski 
(I.A. Vyshnegradsky, I.A. On regulators of direct action, Izvestiya St. Peters- 
burg Technological Inst. (em russo), v.1, 1877). 


Mp=10% 


Região 
Estável 


0.5 1 15 2 2.5 3 3.5 


Figura 8.47: Curvas de terceira ordem. Escolhendo-se o tempo de subida 
normalizado tr e o sobressinal Mp, obtém-se os valores de 81 e G2 requeridos. 


Exemplo: Projeto de um compensador cascata 


Considere o projeto de um compensador avançador de fase para um processo 
do tipo 1 
s+a 1 


Gma = s+b s(s+2) 


(8.315) 


As especificações de desempenho são o sobressinal de 20% e tempo de subida 
de 1s. 


Na figura 8.47, tome-se o ponto 54 = 4.3 e G2 = 2, que corresponde a Mp = 
20%er,=4.5s. 


A equação normalizada é, portanto, 


dy d2y 
as tap 


d 
+ Bo a piyay (8.316) 
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Como se deseja tp = 1s, deve-se fazer uma mudança na escala de tempo 
T = 4.5, o que leva a 
E aaka too x (452M 41 x (45) = (8.317) 
dr? f ` dr? ` “dr Ra ` 
d°y dy dy 
— +194-5 + 40.5— 1.1 ol 
TB + Te + E” + 91.1y (8.318) 


Necessita-se, portanto, ajustar K, a e b de modo que o denominador de 
K(s +a) 
s3 + (2+ 6)s? + (20+ K)s+ Ka 


seja idéntico a 8.318. Deve-se, a posteriori, verificar se a influéncia do zero 


Gmr =K 


(8.319) 


torna o projeto inadequado. 


Resolvendo-se o sistema de equações 


2 +b = 19.3 (8.320) 
2b + K = 40.5 (8.321) 
Ka = 91.1 (8.322) 


obtém-se o resultado desejado, a = 15.9, b = 17.3 e K = 5.7. 


Exemplo: Projeto de um controlador PID 


Considere o ajuste de ganhos de um controlador PID para o processo Sr com 
as mesmas especificações do exemplo anterior Mp = 20% e t, = 1s 
Kps +Kps+K; 1 
Gua = = - E (8.323) 


s(s + 20) s+1 
em que o termo s + 20 é introduzido para tornar o controlador realizável. 
Manipulações simples permitem obter o denominador da função de transferên- 
cia de malha fechada 


Ama = 5 + (21+ Kp)s* + (20 + Kp)s + Kr (8.324) 


Como as especificações são as mesmas do exemplo anterior, o denominador 
desejado é 8.318 e, portanto, 


21+Kp = 19.4 (8.325) 
20 + Kp = 40.5 (8.326) 
Ky =91.1 (8.327) 


resultando Kp = 20.5, Kr = 91.1 e Kp = —1.6. 
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8.11 Otimização de controladores 


Uma forma de aferir o desempenho de um sistema é através da utilização de 
uma função do tipo custo ou de retorno. 


Em problemas de otimização, as funções custo são minimizadas, enquanto 
as de retorno são maximizados. Por exemplo, o gasto com combustível deve 
ser minimizado através de ajustes apropriados dos parâmetros do sistema, 
enquanto a eficiência deve ser maximizada. 


Outras funções podem representar o tempo dispendido para se completar uma 
tarefa preestabelecida, a produtividade do processo, a variância do sinal de 
saída em torno de um valor desejado etc. 

Em princípio, a otimização pode ser aplicada a vários tipos de controladores, 
mas aqui os métodos serão ilustrados para o caso PID, em que serão buscados 
os valores ótimos de (kp, ki, ka). 

Caso a otimizacao fosse aplicada ao projeto de um compensador avancador de 
fase, os valores ótimos buscados seriam de (K,a, 7) da expressão 


Ts+1 


ATE rt (S28) 


GLead = 


sujeito à restrição O <a < 1. 


O problema genérico de otimização no R” consiste em obter um ponto w* € 
R” que minimiza uma função J : R” > R, enquanto satisfaz restrições de 
igualdade caracterizadas por h; : R” — R e de desigualdade gj : R” > R, 
t=1,...,.mpej=1,...,mp: 


min J(w) (8.329) 
sujeito a 

hi(w) = 0 (8.330) 

g;(w) < 0 (8.331) 


O ponto w que minimiza J(w) e satisfaz as restrições é denotado w* (ponto 
de ótimo). 

Por exemplo, considere o problema de otimizar um controlador PD e para isso, 
tome-se como a variável a ser otimizada w = (kp, ka) e escolha como a função 
J a ser minimizada 


Jas | ” le(r)| dr (8.332) 


em que e(t) = r(t) — Y(t) | (i, ka)? OU seja, o erro acumulado de rastreamento 


de r(t) obtido quando se usa o controlador PD com os parâmetros (kp, ka). 
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Caso seja de interesse, podem ser acrescentadas restrições, como 


elos) = 0 (8.333) 

tr < 1s (8.334) 

que significam, respectivamente, erro nulo em regime permanente e tempo de 
subida abaixo de um limite. 

Observa-se que não é necessário considerar o problema de maximização (por 


exemplo, da eficiência e da produtividade), pois 


min J(w) = -max J(w) (8.335) 


A i = .336 
w arg ( min J(u) arg ( max J(w)) (8.336) 
Aqui serão apresentadas, por ora, 3 diferentes classes funções objetivo J: 


1. Compromisso entre algumas características notáveis de respostas, por 
exemplo, 
J(w) = tr + p Mp (8.337) 


que busca reduzir o tempo de subida t, com pouco sobressinal Mp. O 
fator peso p indica qual a importância relativa que se deseja atribuir a 
Mp. 


2. Erro acumulado na tarefa de rastreamento de uma dada referência, já 
apresentado em 8.332, chamado de critério IAE (integral of the absolute 
error). 


As outras formas análogas são 


jee = | mar (8.338) 
Ja = [ rle@lar (8.339) 
J(w) = L re (7)? dr (8.340) 


denominadas respectivamente, ISE (integral of the square error), ITSE 
(integral of the time weighted absolute error) e ITSE (integral of the time 
weighted square error). 


E importante ressaltar que mínimo não é sinônimo de pequeno e o de- 
sempenho do sistema otimizado pode ser insatisfatório. Além disso, é 
importante mencionar que o sistema físico pode apresentar restrições que 
limitam o seu desempenho. Por exemplo, não é possível obter o desem- 
penho de um carro esportivo a partir de um caminhão de carga, mesmo 
com um excelente ajuste do controlador. 
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8.11.1 Sintonizacao de controladores 


Os controladores possuem parâmetros que devem ser ajustados, como os ga- 
nhos kp, kr e kp de um controlador PID. 


Nesse módulo serão apresentados dois enfoques: 


e Satisfação de restrições (ou de Zakian): consiste em obter valores para o 
parâmetro © de modo que as especificações representadas por restrições 
sejam satisfeitas. Por exemplo, Mp < 20 et, <2s 


e Otimização paramétrica: consiste em obter valores para o parâmetro 0 
que minimizam (maximizam) funções de custo (de retorno). Por exem- 
plo, 


So 2 
) t) dt 
min f eot 


em que eg(t) é o erro de rastreamento quando o parâmetro utilizado é 0. 


O critério ITAE 


Para o critério de otimização ITAE, e assumindo o termo livre do denominador 
wk, a função de transferência alvo de malha fechada é da forma 


T(s) = Um (8.341) 
Puls) l 
e, para k = 2,3 e 4, os valores ótimos já calculados para os coeficientes são 
Pa(s) = 824+1.40uns +w? (8.342) 
P3(s) = 8 +1.75wns + 2.150284 we (8.343) 
Pis) = É +210048º +340wis +2. 70w2s+ we (8.344) 


Exemplo 


Considere um processo descrito pela função de transferência 


1 


ore) 


(8.345) 
a ser controlado em malha fechada por uma realimentação tacométrica M (s) = 
1+As. A função de transferência de malha fechada é 
G(s) 
T = 05 8.346 
(s) 1+ G(s)M(s) ee") 
K 


= 8.347 
s +382 + (2+KA)s+K ( ) 
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Assumindo que se deseja utilizar o custo ITAE, utiliza-se a expressão 8.343 
para o denominador desejado (s?+1.75 wy s?+2.15 w2s+w3), obtém-se igualando- 
se os coeficientes que 


3 =1.75wn (8.348) 
2+KA=215 (8.349) 
K = (8.350) 


cuja solução é K = 5.038, wn = 1.714 e À = 0.099. 


Casamento de modelos 


Uma forma interessante de ajustar controladores é construir modelos de refe- 
rência (por exemplo, de segunda ordem com £ e wn desejados) e utilizar um 
algoritmo de otimização para ajustar os parâmetros do controlador minimi- 
zando o custo de descasamento J = [9º |e(t)| dt. 


Caso e(t) convirja para 0 no esquema ilustrado na figura 8.48, ter-se-á obtido 
sucesso em casar o modelo de referência através da combinação do controlador 
e do processo. 


Modelo x 
Xm = AmXm t Bm 
r q e 
rere u Processo x 
ontrolador É sie 
Xp = Kxp,U) 


Figura 8.48: Um esquema de controle baseado em modelo de referência 


Porém, em geral, o casamento perfeito é inexequível, de modo que se estabelece 
uma tolerância, por exemplo, da forma mar{e(t)} < tol. 


Em princípio o método não se limita a processos lineares e o controlador pode 
ser de variados tipos, inclusive não lineares. 


Lembrar, porém, que J mínimo não significa que o descasamento é “pequeno”, 
ou seja, deve-se sempre verificar o desempenho obtido. 
8.11.2 Observações sobre otimização 


1. O Apêndice K apresenta alguns dos métodos mais populares de otimiza- 
ção no R”. 
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2. Nota-se que não é necessário estudar o problema de maximização pois 


in J(0) = — J(0 
ee) Aene) 


correspondendo ao mesmo ponto estacionário 0* 


e* = in J(O 
w(t) 


= arg ( max 1(0)) 


0*ER” 


3. Dependendo das formas das funções J, h e g, o problema de otimização 
pode ter uma solução, várias soluções ou nenhuma solução. A figura 
8.49 ilustra algumas das possibilidades aplicadas à otimização no Rt: 


e A: Função diferenciável, sem restrições sobre o valor de 8. Uma 
condição necessária é J’ = 0. 

e B: Função não diferenciável, mas que possui ponto de mínimo. 

e C: Função descontínua que possui ponto de mínimo. 

e D: Função diferenciável que não possui ponto de mínimo. 


e E: O ponto de mínimo ocorre na fronteira do conjunto viável que é 
fechado. 


e F: Existe o ponto de ínfimo, mas esse não pertence ao conjunto 
viável que é aberto nesse ponto. 


9*-—> 00 


Figura 8.49: Algumas situações encontradas em problemas de otimização. 
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4. Teorema de Weierstrass: Seja O C R” e J : 0 — R. Se J é semicontínua 
inferiormente e O é compacto em R”, então existe 0* € R” tal que 


J (0*) = min J (0) 


Prova em (APOSTOL, 1969). 


5. Vários pacotes computacionais de otimização são disponíveis no ambi- 
ente MATLAB, Scilab, GNU Octave e SciPy (Python), entre muitas 


outras opções. 


8.11.3 Método das desigualdades de Zakian 


O método de projeto de controladores proposto por Zakian consiste em ex- 
pressar as especificações de desempenho em termos de desigualdades a serem 
satisfeitas pelas grandezas envolvidas, quando o controlador encontra-se sin- 


tonizado adequadamente. 


Por exemplo, se o controlador é do tipo PID, como ilustrado na figura 8.50, 
a tarefa seria de obter valores adequados para kp, ky e kp, de modo que 


desigualdades do tipo 


gı (kp, kr, kp) 
92 (kp, kr, kp) 
93 (kp, kr, kp) 
ga (kp, kr, kp) 


tempo de subida < t° 


erro de regime < e 


max ( 


sobressinal < Mpº* 


margem de fase > MF pn 


R(s) + — E(s) 


PID 


U(s) 


EE 


Y(s) 


Figura 8.50: Ajuste de Controlador PID 


00) 


O projeto de controladores pelo método das desigualdades de Zakian requer 
a solução de um problema de encontrar um ponto viável, ou seja, aquele que 


satisfaz as restrições. 


Analogamente ao caso da formulação do problema de otimização, assume-se 
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que as restrições são colocadas na forma 


gı (01, 02,...,04) < (8.355) 
g2 (01; 02,..., 04) < (8.356) 
Jp (01, Gay cig 04) < 0 (8.357) 


Diferentemente do problema de otimização, não se busca minimizar alguma 
função de custo como o tempo de resposta, consumo de energia, erro de regime 
etc.), mas apenas encontrar um ponto que satisfaz todas as restrições. 


Um método de busca bastante similar àqueles utilizadas em problemas de 
otimização é o das fronteiras móveis (Zakian, V. e Al-Naib, U. Design of 
dynamical and control systems by the method of inequalities. Proc. IEE, v. 


120, n. 11, p. 1421-1427, 1973). 


Escolhendo-se no passo k = 0 um valor genérico de 09, as restrições g; podem 
não estar satisfeitas. 


A busca é realizada de modo iterativo, 
Ok+1 = Ok+1 + hk 


em que h aponta para o interior da região viável relaxada na iteração k-ésima, 
até que se obtenha g; < 0 para i = 1,2, ..., p 


Ochs Oze 


Fronteiras 4 0. J 


Relaxadas ; A f e g8) =ci 
eh 


saver Pee Ssss.. < j 
Neee Beer 8;() E 


O Viável 


Região o ai 


Viável 


Figura 8.51: Iterações no método das fronteiras móveis. 
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O objetivo primordial em projetos de controladores é que as especificações 
propostas sejam atendidas. Caso as especificações possam ser colocadas na 
forma de um sistema de desigualdades, métodos numéricos de constraint 
satisfaction podem ser utilizados. Havendo grau de liberdade suficiente, 
pode-se escolher a melhor estratégia de controle mediante a minimização de 
uma função custo (ou maximização do retorno). 


8.11.4 Controle antecipatório ou feed forward 


A ideia central é alimentar as informações sobre o sinal de referência R(s) à 
frente do controlador da malha fechada, geralmente somando-se alguma ação 
diretamente no atuador V(s) = Grr(s)R(s), conforme ilustrado em 8.52 


Feed Forward 


R(s) 


Figura 8.52: Controle antecipatório típico. 


Se o modelo do processo é Gp(s) e o controlado da malha é Gc(s), então o 
efeito de um controlador antecipatório (feed forward) é caracterizado por 


Rs) a - er = ad (8.358) 
E coe E (8.359) 
Se fosse possível fazer Grr(s) = Grs), ter-se ia 
RÉ E cer Grã (8.360) 
E e ce (8.361) 
E on (8.362) 


= 1 (8.363) 
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ee ' sas . = =] 
A solução consiste, portanto, em utilizar uma aproximação para Gp para 
uma faixa de frequências, fazendo-se 


Grrl) = Op! (s)Gaus(8) (8.364) 


de modo que G'rp(s) seja realizável. 
Uma possível escolha para Gaux(s) é 
a? 


Binz 


(8.365) 


em que @ e p são parâmetros a serem escolhidos pelo projetista. 


Na prática o ganho de Grr(s) é reduzido para evitar sinais v(t) excessivos. 


Exemplo 
Seja o processo modelado pela função de transferência 


1 


Cro) = (641) 


(8.366) 


e o controlador proporcional Go = K. 


O valor de K = 1.177 foi ajustado de modo que, sem o compensador Gpr, a 
resposta degrau apresentasse um sobressinal de 20%. 


Escolheu-se a = 10 >> 1 e p = 2, obtendo-se Gpr(s), 


s(s+1) 10? 
1.177 (s+ 10)? 


Gas (8.367) 


de modo que haja pouca influência em baixas frequências. 


A figura 8.53 apresenta a resposta degrau em que se observa, com a presença 
do Grr(s), significativa redução do tempo de subida com reduzido sobressinal. 


8.11.5 Pré-filtro 


Como indica o próprio nome, a função do pré-filtro é reduzir ou realçar com- 
ponentes de certas frequências presentes no sinal de referência R(s). 


Entre as várias possibilidades para o projeto do filtro estão a atenuação das 
altas frequências presentes em variações bruscas de R(s), redução da excitação 
de modos ressonantes indesejados e melhoria do desempenho realçando compo- 
nentes apropriadas do espectro. Para ilustrar um possível efeito do pré-filtro, 
apresenta-se aqui um exemplo numérico. 


300 Engenharia de controle 


Efeito de Feed Forward 


Com Antecipação 
(Feed Forward) 


Sem Antecipação 


tempo [s] 


Figura 8.53: Efeito do controle antecipatório (feed forward). 


R(s) 


Pré-Filtro 


Figura 8.54: Pré-filtro. 


Exemplo 
Considere o caso em que relação original Gmp(s) = me 
s+1 
G = > 8.368 
me(s) s?+0.75s+1 ( ) 


que apresenta sobressinal de ~ 40%. 


Com o intuito de se reduzir o sobressinal, deseja-se inserir, na entrada de 
referência, um filtro Gpp (s) tipo bloqueia-banda (notch) para atenuar wn = 
l rad/s. 


s? + wns + (0.9wn)? 


G 8.369 

pr(s) s2 + 2wns + (0.9wn)? 
s? + s + 0.9? 

= — 8.370 

s2 + 2s + 0.92 ( 


O resultado pode ser visto na figura 8.55, em que o sobressinal é drasticamente 
reduzido, embora com alguma elevação do tempo de subida. 
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Pré-filtro 


7 Sem Pré-Filtro 


tempo [s] 


Figura 8.55: Redução do sobressinal utilizando pré-filtro. 


8.11.6 Controle posicast 


Na seção anterior foi apresentado um pré-filtro do tipo LTI caracterizado pela 
função de transferência Gpr(s). 


Porém o condicionamento do sinal de referência pode ser mais elaborado, en- 
volvendo não linearidades ou variações temporais. 


U 
E(s) Gus) SI ao | Y(s) 


Lógica de 
Comutação 


R(s) 


Figura 8.56: Exemplo de controle posicast. 


Um exemplo é o caso do controle posicast (Smith, O. J. M. Posicast con- 
trol of damped oscillatory systems. Proceedings of the IRE, v. 45, n. 9, p. 
1249-1255, 1957. 


Dada uma resposta a uma entrada degrau desejada de valor U, a ideia é ajus- 
tar inicialmente a referência constante de modo que, no instante de pico tp, O 
valor da saída y(tp) seja justamente U. 


Nesse instante (tp), a referência constante é ajustada para U, de modo que o 
o sistema entre em equilíbrio. 


Com esse método, é atingido o valor desejado sem incorrer em sobressinal. 

A figura 8.57 apresenta uma comparação entre os casos com e sem a utili- 
zação do controle posicast. 
Convém ressaltar que o controle posicast é muito sensível a erros de modelagem 
e imprecisões no instante de comutação. 
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Controle Posicast 


jal | JaA |(1+0.2)A 
i 


tempo [s] 


Figura 8.57: Controle posicast com ausência de sobressinal devido à manipu- 
lação do sinal de referência. 


8.11.7 Algumas personalidades destacadas 


Os resultados seminais no tocante a ferramentas para projetos de controlado- 
res no domínio da frequência, agrupados no que alguns chamam de métodos 
clássicos, surgiram aproximadamente entre 1920 a 1950, incluindo o período 
de esforços de guerra. 


Aqui são apresentados alguns dos pesquisadores que contribuíram para o es- 
tabelecimento desses métodos clássicos, embora o número de personalidades 
ilustres seja significativamente maior. 


1927 Harold Stephen Black (1898-1983) utiliza realimentação negativa para 
reduzir a distorção em amplificadores. Black inventou, independentemente, o 
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amplificador a realimentação negativa, enquanto viajava no Lackawanna Ferry 
do terminal de Hoboken a Manhattan. 

1934 Harold Locke Hazen (1901-1980) torna popular o termo servomechanismo 
através da publicação: Hazen, H. L. Theory of Servomechanisms. J. Franklin 
Inst., v. 218, p. 209-331, set. 1934. 1938 Hendrik Wade Bode (1905-1982,) 
propõe a utilização da resposta em frequência e introduz as noções de margem 
de ganho e de fase. 

1947 Nathaniel B. Nichols (1914-1997) desenvolve a carta de Nichols para 
projeto gráfico de sistemas de controle. 

1948 Walter Richard Evans (1920-1999) concebe o método do lugar geométrico 
das raízes (LGR). Em 1965, Evans inventou o Spirule, que permitia traçar e 
interpretar rapidamente os LGRs. 


8.12 Exercícios 


8.12.1 Exercício: Efeito da saturação de ganho 


Qual o valor de M > 0 a partir da qual ocorre oscilação sustentada? Deter- 
minar também a frequência e a amplitude da oscilação, caso ocorra. 


0 1 0 0 
x = |o 0 1|x+| 0] f(y) (8.371) 
Qn aê 2 
ue (ás (8.372) 
M se y>l 
fy) = My se |y|<1 (8.373) 


-M se y<-l 


8.12.2 Exercício: Traçado de trajetórias no plano de fase 
Considere um modelo não linear no espaço de estados {21,72} dado por 


Ly = T2 (8.374) 
to = —a + sign(x2 — 21) (8.375) 


em que 
1 se €>0 


sign(€) = op a 2G (8.376) 


Esboçar trajetórias típicas no plano de fase. 
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8.12.3 Exercício: Relé com histerese 


Esboçar trajetórias típicas no plano de fase do sistema ilustrado na figura 8.58, 
em que o relé de acionamento apresenta histerese. 


Figura 8.58: Relé com histerese acionando um sistema de segunda ordem. 


Repetir o exercício para 


U(s) ~ @+s—2 ee 


8.12.4 Exercício: Relé com histerese e zona morta 


Esboçar trajetórias típicas no plano de fase do sistema ilustrado na figura 8.59, 
em que se utiliza um relé com zona morta e histerese, realimentado por um 
filtro linear. 


Esse problema é extraído de um projeto de orientação de uma carga útil de 
foguete de sondagem utilizando binários obtidos por jato de ar comprimido. 


0.4 
1+0.075s 


Figura 8.59: Caso de um relé que apresenta simultaneamente histerese e zona 
morta. 
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8.12.5 Exercício Computacional 


Utilizando um software para simulação digital, traçar trajetórias típicas no 
plano de fase 

i = atyte?+y? (8.378) 

= rt-y-r +y (8.379) 


8.12.6 Exercício: Efeitos da quantização de sinais 


Esboçar trajetórias típicas no plano de fase para o sistema da figura 8.60, em 
que o atuador apresenta quantização. 


Figura 8.60: Não linearidade do tipo quantização. 


8.12.7 Exercício: Servomecanismo com atrito seco e quantização da 
saída 


Esboçar trajetórias típicas no plano de fase de um servomecanismo em que há 
presença de atrito seco e o sensor de posição apresenta discretização (como o 
caso em que se utiliza um encoder). O diagrama de blocos do servomecanismo 
é visto na figura 8.61. 


8.12.8 Exercício: Lugar geométrico das raízes 


Considere um processo representado no espaço de estados por 


0 1 0 0 
E = 0 0 1jfjgz+ļ|0ļu (8.380) 
ze = oe: 1 
y=[100]z (8.381) 


em que a > 0. 
Esboçar o lugar geométrico das raízes para a variando de 0 a oo. 
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Figura 8.61: Diagrama de blocos para o servomecanismo com atrito seco e 
discretização do sensor de posição. 


8.12.9 Exercícios: Lugar geométrico das raízes - LGR 


Esboçar o lugar geométrico das raízes para os vários processos apresentados 
a seguir, assumindo que o parâmetro a ser variado de 0 a co é o ganho K de 
A(s) =1+ KG(s): 


1. 
G (s) = is a (8.382) 
2, 
G (s) Es 7) (8.383) 
3. j 
G (s) = ia a (8.384) 
4. 
G()=— Tp = (8.385) 
5. 
G(s) = a (8.386) 
6. 
G(s) = G9 9543) (643) ee) 
7 E 
os (8.388) 


s(s+1) 
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8. 
1 

A E (1 + s +0.58?) (aa 

9. , 
ame E ” (8.390) 

10. oe 
Ce = ao (8.391) 

1. 

E) (8.392) 


Gio (s2 + 2s + 2) (s2 + 2s + 5) 


8.12.10 Exercício: Ajuste de ganho 


Ajustar K de modo que os sistemas, quando operados em malha fechada com 
realimentação unitária, apresentem sobressinal de aproximadamente 16.3% 
para entrada degrau, quando operado em malha fechada com ganho unitá- 


1. 
= K (s+ 4) 
G(s) = s (s +2) (+5) (52 + 1.25 + 64.36) (8.393) 
2, 
K (s? +48 + 5) 
ae (8.394) 


P= (s2 + 1) (s + 4) (s +6) 


8.12.11 Exercício: 


Observe a figura 8.62. Verificar se é possivel ajustar o valor de B, de modo 
que o os ramos do LGR cruzem o eixo imaginário em +73 


8.12.12 Exercício: Controle de um Levitador Magnético 


Considere o sistema de levitação magnética, esquematizado na figura 8.63. As 
equações que descrevem o seu comportamento dinâmico são: 


i LR = (8.395) 
dy i? 
mp = mg— a (8.396) 
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Figura 8.62: Ajuste da posição de um polo de malha aberta de modo que os 
ramos do LGR passem por pontos predefinidos. 


Assumir que R = 10, L = 10mH, m = 0.1 kg, g = 10ms?, K = 1 Nm/42 e 
a = 1. Linearizar o sistema em torno de y = yo = 5cm e obter uma lei de 
controle v em função de z, de modo que, para pequenas perturbações do tipo 
degrau, Mp < 16.3%. 


Fotodetetor 


Figura 8.63: Um sistema que permite levitar uma esfera ferromagnética em 
uma altura ajustável. 


8.12.13 Exercício: Controlador para sistema com atraso 


Considere um sistema industrial típico, descrito pela função de transferência 


e > 


o EE 


(8.397) 
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Projetar um controlador Gc(s) tipo PI , juntamente com um preditor de 
Smith, de modo que o sistema apresente 16.3% de sobressinal e um tempo de 
pico de 5s. 


8.12.14 Exercício: Projeto de compensadores 


O diagrama de blocos em 8.64 aplica-se a todos os itens deste exercício. Pro- 
por compensadores Gc (s) para os vários processos Gp (s) de modo que as 
especificações de desempenho sejam atendidas: K, > 15, e(co) = 0 se r(t) é 
do tipo degrau, Mp < 20%, tr < 0.58 e ts(5%) < 1.25 


Figura 8.64: Um diagrama de blocos típicos envolvendo um controlador cas- 
cata. 


1. 
s+1 

E Ea) G 

2. ; 
on) s2+0.65+9 P 

3. , 
Gp (s) =- ah (8.400) 

4. i 
Gp (s) = Ti (8.401) 
i G = = 8.402 
PO GA) eo) 

6. m 
Gp (s) = (8.403) 


(s + 1) (s + 10) 
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8.12.15 Exercício: Expressão fechada para compensador avançador de 
fase 


Sabe-se que uma função de transferência G(s) é tal que para uma certa 
frequência angular dada we, tem-se 


|G (jwe)| = M (8.404) 


LG (jue) = 4 (8.405) 


Assumindo que é fornecido um valor 7 > 0, obter expressões para ag, a1, bo e 
bı, de modo que o compensador avançador de fase 
a ,s + ag 


seja tal que, em we, O sistema compensado apresente a margem de fase (MF) 
de m, ou seja, 
Ge (jwe) G (jwe)| = 1 (8.407) 


£Gc (jwe) G (jwe) = — 180° (8.408) 


Observação: Uma possível resposta é: 


Q 
iwe va (8.409) 
sis Ole (8.410) 
Q 
Bee (8.411) 
py ie (8.412) 
We 
em que 
dio ts 
eee ae (8.413) 
l+siny 


yp = n—y- 180º (8.414) 
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Métodos no Domínio do Tempo 


“Simple solutions require the most advanced thinking.” 
— Richie Norton 


Este capítulo apresenta alguns enfoques primordialmente baseados no domínio 
do tempo e que são muito utilizados na prática. 

Com o intuito de preservar a simplicidade, a maior parte deste capítulo assume 
modelos SISO (single input single output), embora vários resultados possam 
ser estendidos a sistemas multivariáveis (MIMO). 

Os casos em que não há maiores dificuldades em tratar de modelos MIMO 
são facilmente reconhecidos ao longo do texto pela utilização de símbolos em 
negrito y e u para representar, respectivamente, o vetor de saída e o vetor de 
entrada. 

Os problemas multivariáveis são tratados em excelentes textos como (SKO- 
GESTAD; POSTLETHWAITHE, 1996), (MICHEL, 1996), (KAILATH, 1980), 
(HESPANHA, 2009) e (ZHOU; DOYLE; GLOVER, 1995), entre outras obras. 


9.1 Realimentação de estado 


Uma propriedade muito importante de modelos lineares controláveis é que os 
polos podem ser alocados em posições arbitrárias escolhidas pelo projetista, 
através do emprego de uma lei de controle do tipo realimentação de estados 


u(t) = -Kx (t) + v(t) (9.1) 
em que K é uma matriz constante e v (t) é a nova entrada. 
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Um método que permite a determinação imediata de K para o caso em que 
B é uma matriz n x 1 consiste em realizar, inicialmente, uma transformação 
linear (ou transformação similar). 


Seja o modelo genérico no espaço de estados 


x = Ax+Bu (9.2 
y = Cx 


(eX) 
o so 


assumido ser controlável e tome-se uma matriz P não singular. 


O mapeamento P : R” > R” dado por 
Px (t) = z(t) (9.4) 


ou 
x(t) = P~'z(t) (9.5) 
representa uma transformação linear. 


Notando que 


x=P lz (9.6) 

tem-se que 
Pl; = AP 'z4+Bu (9.7) 
y = CP lz (9.8) 


A transformação linear P corresponde a uma mudança de base. Nesta nova 
base, o modelo assume a forma 


z = PAP 'z+PBu (9.9) 


y = CP lz (9.10) 


A mudança de base altera a representação, mas as características dinâmicas 
são preservadas. 


De fato, a função de transferência continua inalterada 


G(s) = C(1-A) B (9.11) 


= CP (sI- PAP) PB (9.12) 
= C(sI-A)B (9.13) 
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Se a representação é completamente controlável, sabe-se que a matriz 
U=|B AB: AMIB 


é nao singular e, portanto, inversivel (no caso de sistemas com varias entradas 
a matriz U teria mais do que n colunas e o método necessitaria ser estendido). 


Denote por p a última linha de U~! e observe que 


I = UU (9.14) 
= |: |[B AB aB] (9.15) 
p 
= ; af REE l (9.16) 
pB pAB ... pA”IB 


Como a última linha da matriz I é [0...01], tem-se que 


pB = 0 (9.17) 
pAB = 0 (9.18) 
: (9.19) 
pA"'B = 1 (9.20) 
Monta-se, agora, a matriz P, conforme o arranjo 
P 
pA 
P= . (9.21) 
pari 
O posto da matriz P é n, pois 
0 0 1 
0 0 1 x 
PU=|: : ee (9.22) 
0 1 * 
1 x * 


e P pode ser utilizado para realizar uma transformação similar 


A = PAP”! (9.23) 
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ou, escrita de outra forma, 


AP = PA (9.24) 
Substituindo-se P, obtém-se 
p pA 
a ES | = ne (9.25) 
par-l pA” 


e, portanto, conclui-se que a estrutura de A é 


0 1 0 e. 0) 
0 0 1 0 
A=| : É Ra 2 (9.26) 
0 0 0 1 
—-An —An-1 —An-2 —Q 


A forma particular de A, é conhecida como de “matriz companheira”. 


Da última linha da expressão AP = PA, tem-se 


—anP — Gn_1pA —---—a,;pA"™! = pA” (9.27) 
P (nl -an-A -+ aA") = pA" (9.28) 
A" +a A! +. anA al = 0 (9.29) 


e permite constatar que os termos —a; de A são os coeficientes do polinômio 
característico A(A) = det(AI — A), com os sinais trocados. 


A matriz B também possui uma estrutura simples, pois 


p 0 

= pA : 
B = PB= . B= D (9.30) 

pA”! 1 


Determinação do ganho de realimentação 


Utilizando-se a realimentação de estado u = —Kz + v na representação À e 
B, tem-se que 


- Bu 
+B 


Kz + o| (9.32) 


[> 
= (A-BK)z+Bv (9.33) 
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e focando a atenção para o termo (A — BK) 


0 1 0 0 

A-BK = l - Ee ky | 
0 0 1 0 
—An —An-1 —aj 1 


(9.34) 

verifica-se que K está presente apenas na última linha da matriz companheira 
0 1 vee 0 

A-BK = e (9.35) 


an — kn an-1 — kn-1 © ap — ki 


Supondo que são fornecidos pelo projetista os polos desejados {A1, ..., An}, a 
tarefa agora é obter K tal que o polinômio característico de A — BK seja 


Ap(s) = (s— à)... (s— An) (9.36) 
s” + as”! +- an-s + an (9.37) 


Agrupando os termos de mesma potência em s, obtém-se o sistema 


an = an+kn (9.38) 
: (9.39) 
q = at ky (9.40) 


Uma vez que K tenha sido encontrada, a versão não transformada pode ser 
obtida imediatamente, notando que 


u(t) = —Kaza(t)+v(t) (9.41) 
eee 
= — KP x(t)+ v(t) (9.42) 


Exemplo de realimentação do estado 


Considere o modelo do motor DC apresentado anteriormente, para o qual 
se deseja determinar o ganho de realimentação de estado, de modo que o 
sobressinal seja de 16.3 % e o tempo de pico de 0.9 s para uma entrada tipo 
degrau. 
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As especificações correspondem a € = 0.5 e wn = 4 e o polinômio característico 
desejado é 
Ap(d) = 7+ 2kunrA+ wn 
= 44416 (9.43) 


O modelo do motor DC já está na forma canônica companheira controlável, 


0 1 0 
a-f 2 iJe] an 


Denotando-se a matriz de ganhos de realimentação por K = | kə ky |. a 
expressão A — BK é da forma 


0 1 
a-BK=] a (9.45) 


O polinômio característico de A — BK é 
A (A) = à? + (3 + ki) à + (2 — ke) (9.46) 
Portanto, o sistema a ser resolvido é 


16 = 2+k (9.47) 
4 = 3+h (9.48) 


que possui a solução kı = 1 e kg = 14. 


Exemplo, sem controlabilidade completa 


Quando a controlabilidade não é completa, alguns dos autovalores podem não 
ser alocáveis. 

Considere as mesmas especificações do exemplo anterior, ou seja o sobressinal 
de 16.3 % e o tempo de pico de 0.9 s para uma entrada tipo degrau, mas desta 
vez utilizando um modelo não (completamente) controlável. 


0 0 -6 3 
A=|1 0 1 |:B=[|1 (9.49) 
0 1 =6 0 


Os autovalores dominantes devem corresponder a É = 0.5 e wn = 4 e o terceiro 
autovalor —p deve estar distante em relação àqueles dominantes. 


Ap(à) = (A+p) (A? +4 +16) (9.50) 
= X+(p+4)M4 (4p+16)à+16p (9.51) 
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Sob a lei u = -Kx + v com K = | k3 kə ky |, tem-se a nova matriz de 
sistema 
0 0 —6 3 
A-BK = [10 11) -[1|[k k k] (9.52) 
0 1 —6 0 
3k3 3ke 3k, — 6 
= 1— k3 k2 kı — 11 (9.53) 
0 1 —6 


cujo polinômio característico é 


A (A) = à? + (ko +3k3 +6)A? + (kı +9k2+18k3 + 11)A4 (3kı +18k2 +27k3 +6) 
(9.54) 
Igualando-se os coeficientes de A(A) e Ap(A), obtém-se o sistema de equações 


ko+3hk3+6 = p+4 (9.55) 
kı +9ko + 18k3 +11 = 49416 (9.56) 
3k, + 18k2+27k3 +6 = 16p (9.57) 
ou, na forma matricial, 
3 1 0 k3 p— 2 
18 9 1 ko | = | 4p4+5 (9.58) 
27 18 3 ky 16p — 6 
n—-—[{{_—__—“ 
M 


O posto de M é 2, de modo que nao é possível obter a solução para p qualquer. 


De fato, eliminando-se a dependência linear usando kg + 3k3 + 6 = p + 4, 
obtém-se 


kı —9k3 = 23—5p (9.59) 
3k, —27k3 = 30-2p (9.60) 


Se p # 3, não há solução, significando que o polo —3 nao pode ser deslocado, 
ou seja, o modo associado não é controlável. 

Uma solução possível é p = 3 e k3 = 0, k2 = 1 e ky = 8, o que fornece 
REE di 
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Inserção de integrador na malha 


A inserção de um integrador na malha tem o propósito de fazer y(t) — r(t) 
tender a O para t > oo no problema de regulação, ou, em outras palavras, 
e(oo) = 0 ( e(t) € R, t fixo). 


Figura 9.1: Inserção de integrador na malha de controle 


A ideia é aumentar o estado através da inserção de um componente extra 
zr E€ R que é a integral do erro e(t) = r(t) — y(t), de modo que se obtém 


xp = Axp+Bu (9.61) 
i = I Fes =a ae (9.62) 
y = Cxp (9.63) 


ou, tomando-se a derivada de x; e substituindo-se a expressão de y(t), 


sê (9.64) 
= r-y (9.65) 
r—Cxp (9.66) 


Denotando-se por x, o estado aumentado 


Xa = | a | (9.67) 


TI 


e assumindo-se uma lei de controle do tipo realimentação de estados (aumen- 
tado) 


u=-]| Kp br) pe] (9.68) 
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resulta que 


(9.69) 


Xa 


I 
———1 
La 


= A 0 Xp B 0 

= | o J | a Fal ca | (r — Cxp) (9.70) 

o A -BKp -Bk; Xp 0 

[ABR Bu Pe] 0) a 
Ag Xa Ba 


e os autovalores de A, podem ser ajustados mediante manipulação de Kp e 
de k I- 


9.2 Observador de estados 


A implementação da lei de controle u = —Kx + v requer a medida de todos 
os componentes do estado x, através de vários sensores e transdutores que 
significam custo, peso, volume e taxa de falhas, entre outros fatores. 


Quando a representação (A, C) é observável, pode-se utilizar as saídas y para 
obter uma estimativa X de x e implementar a lei de controle. 


u= —-Kx+v (9.72) 


Um observador, observador de Luenberger, estimador de estados ou reconstru- 
tor de estados é um mecanismo usado para obter X (t) = x a partir de registros 
da entrada e da saída {u (t),y (t)}. 


Seja um modelo completamente observável da forma 


x = Ax+Bu ;x(to) = xo (9.73) 
y = Cx (9.74) 


Uma proposta é combinar as informações do modelo e das medidas. 


Modelo Medidas 
; PEEN ——_. 
R = AR+Bu+L(y-9) :X(to) =O (9.75) 
y = Cx (9.76) 


Na ausência de estimativas iniciais, é usual adotar * (to) = 0. 


Subtraindo-se a equação de x de x, obtém-se que 


x— x= A(x—x)-—LC(x-) (9.77) 
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Definindo-se o erro de estimação como 


constata-se que a sua dinâmica é da forma 


x = Ax—LCx (9.79) 
(A —LC)x (9.80) 


Se os autovalores da matriz (A — LC) tiverem a parte real negativa, x (t) > 0 
a medida que t 7 oo e, portanto, em regime permanente, 


x(t) = X(t) (9.81) 


9.3 Observadores de ordem reduzida 


Quando alguns dos componentes do estado são medidos diretamente, pode-se 
utilizar um estimador de ordem reduzida. 


Ou seja, necessita-se estimar apenas aqueles componentes não medidos de x. 


Considere um modelo em que Xm são os componentes medidos que estão in- 
corporados no vetor da saída y e sejam xy os componentes desconhecidos 


ae = .82 
=| x | E dle. ii Ba |" a) 
à = [1 0} |= | (9.83) 
Explicitando a expressão de Xm, tem-se que 
Xm = AmXm + Cxg + Bmu (9.84) 
Notando que 
Xm=y (9.85) 
tem-se que 
y = Amy + Cxa + Bru (9.86) 
Introduzindo a notação 
y = ý — Amy — Bnu (9.87) 


obtém-se a expressão 
y = Cxg (9.88) 
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Por outro lado, explicitando a expressão de xq, tem-se que 


Xq = A21Xm + Agxa + Bau (9.89) 
Definindo-se 
u = Asxm + Bau (9.90) 
resulta que 
xa = Agxg tt (9.91) 


Juntando-se os resultados obtidos, tem-se que 


xa = Agxg+U (9.92) 
y = Cx (9.93) 


que está na forma vista anteriormente para um observador de ordem completa 
e, portanto, o observador para Xq usando (u,y ) é da forma 


Za = Ada +U+L(y¥— CR) (9.94) 


9.4 Filtro de Kalman: tempo continuo 


Aqui, o filtro de Kalman é tratado como um filtro quadrático, ou um caso 
especial do observador de Luenberger em que o ganho é escolhido de modo a 
minimizar a covariança do erro de estimação. 


Um tratamento rigoroso do filtro de Kalman de tempo contínuo requer ferra- 
mentas matemáticas sofisticadas para caracterizar o ruído branco e, portanto, 
a apresentação neste livro busca apenas fornecer uma noção heurística. 


Considere um modelo em que a equação de estado é perturbado por um pro- 
cesso estocástico w(t) e a saída é afetada por um ruído v(t) 


= Ax+Bu+ Fw (9.95) 
y = Cx+v (9.96) 


em que w(t) e v(t) possuem distribuição normal, w(t) Lv(s), Vt,s e 


Elw(s)w? (t)] 
Elv(s)v (1)] = Ró(t-s) R>0 (9.98) 


| 
© 
œ 
— 
~œ 
| 
(VA) 
x 
© 
V 
© 
No) 
© 
q 
nd 


Retoma-se a expressão do observador de estados 


Ax+Bu+L(y—-y) (9.99) 
= CR (9.100) 


<) >) 
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O erro de estimação X é dado por 
K=x—-k (9.101) 
Busca-se, agora, a expressao para L(t) que minimiza 
P(t) = E[x(t)x(t)"] (9.102) 


que é a covariança do erro de estimação (intuitivamente, o quanto o “estado 
estimado” está “disperso” ao redor do “estado real”). 


Subtraindo a equação do estado estimado da equação de estado original 9.95, 
obtém-se que 


x=(A-LO)X+Fw-— Lv (9.103) 
Para estudar como varia P com o tempo, determina-se 
f d o 
P = EROH] (9.104) 
= AP+PA?—-LCP-—PC’L’+FQF’+LRL’ (9.105) 
Note que 


(LR — PCOR-I(LR — PC’)? = LRL? — LCP — PC’L? + PCTR ICP 
(9.106) 
mas falta o termo PCTR-!CP na expressão 9.105. 


Somando e subtraindo o termo PCTR-!CP, obtém-se que 


P = AP+4+PA!+FQF!4LRL! - LCP -PC!L” (9.107) 
AP + PA’ + FQF! + LRL” - PCR !CP (9.108) 
+(LR — PCOR HLR — PC’)? (9.109) 
O termo quadrático (LR — PC’)R~!(LR — PC’)? tenderia a fazer os ele- 
mentos de P (em particular os da diagonal) crescerem, e, portanto, escolhe-se 
L que o anula, ou seja, 

L = PCR! (9.110) 

que é uma expressão semelhante àquela do problema LQR. 


Nesse caso, a matriz de covariança do erro de estimação é dada por 
P = AP+PA’+FQF’+LRL’—PC’R'CP (9.111) 
P(0) = Elx(0)x(0)7] (9.112) 
que é a equacao de Riccati vista anteriormente. 


De fato, o problema otimização (LQR) e o de filtragem (Filtro de Kalman) 
são duais em um certo sentido, mas cuja análise foge ao escopo deste texto. 
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9.5 Observador de Perturbações 


Seja D(s) uma perturbação aditiva na entrada do processo G(s), de fase mi- 
nima, cuja saída Y (s) e a entrada é V(s) 
Y(s) = G(s)[V(s) + D(s)] 


Se fosse possível dispor de G-!(s), então 
poder-se-ia escrever 


GH s)Y(s) = V (s) + D(s) 


e, portanto, a estimativa da perturbação se- 
ria dada por 


Dis) = G~1(s)Y(s) — V(s) D(s) Pode nao ser propria 


Porém, se G(s) for estritamente própria (ou Figura 9.2: Estrutura básica 
seja, grau do denominador > grau numera- de um observador de perturba- 


dor), G~!(s) não será própria. ções. 


Para contornar esse problema, projeta-se um filtro Q(s) tal que Q(s)GT t(s) 
seja própria e incorpora-se esta na estrutura como esquematizado na figura 
9.3, já incluindo o ruído de medida N(s) 


D(s) 
U(s) Y(s) 


A 
D(s) 


Figura 9.3: Um método para atenuação do efeito de perturbações. 


D(s) = Q(s)G™ (s) [Y (s) + N(s)] — Q(s)V(s) 
Se |Q(jw)| = 1 na faixa da frequência de interesse para a malha de controle, 
tem-se que D(jw) = D(jw). 


Exemplo de aplicação 
Considere o processo modelado pela função de transferência 


1 


O eS 
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Assuma que as entradas são U(s) = 2 (degrau) e D(s) = DEDE (sinal 
senoidal). 
Escolhendo-se i 
s) = ——_,; 
As) (s+ 1) 


obtém-se a resposta vista na figura 9.4, em que a perturbação é significativa- 
mente atenuada. 


Resposta degrau c/ e s/ DOB 


0 20 40 60 80 100 
tIs] 


Figura 9.4: Exemplo ilustrativo do efeito de um observador de perturbações. 
Linhas azul e vermelha, respectivamente, sem e com o observador 


9.6 Observadores de estado: tempo discreto 


O observador de estado para modelos de tempo discreto é semelhante ao do 
caso contínuo. 


Dado um modelo 


x[k+ 1] = Ax[k|Bulk] (9.113) 
ylk] = Cxlk] (9.114) 


propoe-se o observador de estados 


R[k+1) = Ax[k] + Bulk] + L (y[k] — Ş[k]) (9.115) 
Fr = CR, (9.116) 


O erro de estimação é definido por X[k] = x[k] — X[k]. 


Métodos no Dominio do Tempo 325 


Subtraindo-se as expressões de x[k + 1] e X[k + 1], obtém-se que 
X[k + 1] = (A — LC) X[k] (9.117) 


e X[k] — x[k] se os autovalores À; de A — LC tiverem norma ||À;|| < 1, Vi = 
Te tence. 


9.7 Filtro de Kalman: tempo discreto 


Analogamente ao filtro de Kalman de tempo continuo, trata-se de um ob- 
servador de estados em que o ganho é ajustado de modo que se minimize a 
covariança do erro de estimação. 


Considere o modelo 


xlk+1) = Ax[k] + (Bulk]) + Fwlk] (9.118) 
ylk] = Cx[k] + vík] (9.119) 


em que w[k] ~ N(0, Q) ii.d., v[k] ~ N(0, R) i.i.d e vli] Lw[j] Vi, j. 
Observação: Variáveis aleatórias w[k] i.i.d. são aquelas independentes e igual- 
mente distribuídas. 


O termo Bulk] pode ser acrescentado posteriormente, uma vez que o sistema 
é linear e, portanto, será omitido na presente apresentação. 


Assume-se que o modelo é disponível (ou seja, A, B, F, C, Q e R são dados) 
e que são fornecidas medidas Yp = {y[0], y[1],..., y[A]}. 


Adota-se, ainda, a notação 


R[k|i] = El[x[k]| Yi] (9.120) 
X[k|i] = x(k] —x[k|q] (9.121) 
Plklij = Elx[k| i) X[k] J" (9.122) 


em que E[x[k] | Y;] é a esperança condicional de x[k] dado Y;. 
A matriz P{k|i] é simétrica positivo definida, uma vez que é matriz de covari- 
ança. 


Aplicando-se o operador E|. | Y;,_1] na equação de estados, tem-se que 
E| x[|k]|Yk-ı] = E[Ax[k- 1] + Fw[k — 1] | Ye | (9.123) 
AE[x[k — 1] | Ye | (9.124) 


ou 
£lklk — 1] = AR[k— 1k—1] 
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Agora, no instante k, deseja-se obter £[k|k] a partir de £[k|k — 1] e da nova 
medida y[k). 


Lembrando da estrutura do observador de estados, seja 


X[k|k] = £[klk — 1] +L | y[k] — Cx[k|k — 1] 
Ve ee 
O termo z é chamado, na literatura, de inovação, já que representa a diferença 
entre o que foi medido y|k] e o que se esperava medir (Cx[k|k — 1]). 


O erro de estimação no instante k é dado por 


x[k,k] = x(k] — Ík, k] (9.125) 
= x(k] —x[k|k — 1] — L (y[k] — Cx [kk — 1]) (9.126) 
= x(k] — £[k|k — 1] — L (Cx[k] + is — C&[k|k — 1]) (9.127) 
= (I-LC) (x[k] — £[k|k — 1]) — Lvlk] (9.128) 
= (I—LC)x[k|k — 1] — Lv[k] (9.129) 
Portanto, a matriz de covariança do erro de estimação é dada por 
P[k|k] = Elx[k|k) xĪk|k]] 

= (I-LO) El&lklk — 1] ¥[k|k — 1] (1- LC)” + LRL” 

= (I-LO)PIk|k-1](1- LC)” + LRL? (9.130) 


= Plklk — 1] —LCP[k|k — 1] — P[k|k — 1J]CTL? + 
+L (CP[&|k —1]C7 + R) L7 
Deseja-se que o erro de estimação possua “dispersão” pequena, ou seja, que os 
elementos de P[k|k] sejam pequenos. 
Uma condição necessária para o ponto de mínimo é 


d 


-PIRK = 0 


em que dP /dL é utilizado sem um formalismo rigoroso. 
A expressão de P[k|k] é uma quadrática em L, de modo que 


d 
dL 


levando à expressão do ganho L 


P[k|k] = —2P[k|k — 1]C7 + 2L (CP[kk - 1]C7 + R) = 


= P[k|k — 1]C7 (CPR - 107” +R) 


Métodos no Domínio do Tempo 327 


Substituindo o L escolhido na expressão de P[k|k], tem-se após cancelamento 
de vários termos que 


P[k] P[k|k — 1] — LCPIk|k — 1] (9.131) 
= (I-LC)P[k|k-1] (9.132) 

Para colocar P[k|k] em função de (P[k — 1|k — 1]), note que 
Plklk-1] = a k — 1| X[k, k — 1]7] (9.133) 
=  El(x[k] — [klk — 1]) (x[A] — RIkJk —1])"] (9.134) 


Adote-se a expressão auxiliar 


M 2 Ax[k — 1] + Fwlk — 1] — &[k|k — 1] (9.135) 
Nessas condições, 
P[k|k-1] = EIMM!| (9.136) 
= EI(AX[k — 1] + Fw[k — 1)) (Ax[k — 1) + Fx[k— 1]))”] 
AP[k — 1|k — 1]A” + FQFT (9.137) 


Juntando as partes, tem-se o filtro de Kalman, usualmente descrito em duas 
fases: propagacao e atualizacao. 

Fase de propagação: Dado x[k — 1|k — 1] e P[k — 1|k — 1] determinar x[k|k — 1] 
e Plklk — 1]: 


Slklk- 1) = AR[k-1|k-1] (9.138) 
Plklk-1] = AP[k-1|k- 1]A! + FQF? (9.139) 
L = Plklk-1]CT (CPIkk-1]CT+R) * (9.140) 


Fase de atualização: Tendo-se realizado uma nova medida y[k], faz-se a atua- 
lização 


x[k|k] = x[klk— 1] +L (y[k] — Cx[k|k — 1]) (9.141) 
Plklk] = (I-LO)P[klk-1] (9.142) 


Observação: Note que (I — LC) P[k|k — 1] pode deixar de ser simétrica e de 
ser positivo definida, devido a erros numéricos. Para evitar esse problema, 
pode-se utilizar a expressão 9.130 


P[k|k] = (I — LC) P[k|k — 1](1—- LO)” + LRL? 


conhecida como fórmula de Joseph. 
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Exemplo 


Considere o modelo discretizado dado por 


OR | 0.9951 0.0485 | ne | 0.0049 | ie | 0.01023 


—0.1938 0.9370 0.1938 0.00871 g= | ee | 


(9.143) 
1. O modelo é observável e o filtro de Kalman pode ser utilizado. 


2. Os ruídos são N (0, I) independentes e identicamente distribuídos (i.i.d.) 
e tais que w L v. 


A figura 9.5 apresenta o resultado da utilização do filtro de Kalman que produz 
uma estimativa muito próximo ao y sem o efeito do ruído (linha púrpura). 


Saida y com ruídos 


y(t} com ruídos 


0 1 2 3 4 5 6 


E | 
2 

© 

S | 

Zol | 
€ | 

E 


3 
tis] 


Saida y-chapeu usando Filtro de Kalman 


Figura 9.5: Exemplo de estimação de estados usando filtro de Kalman. Gráfico 
Superior: Linha azul é o sinal de saída com ruído aditivo. Gráfico Inferior 
Linha azul é o sinal de saída após a subtração do ruído estimado. 


O observador de Luenberger permite obter uma estimativa x de x, evitando 

a necessidade de adquirir pelo menos tantos sensores quanto o número de 
componentes do vetor estado. O filtro de Kalman é um caso especial do 
observador de Luenberger em que se minimiza a covariança do erro de es- 
timação. Quando alguns componentes do estado sao medidos, basta que se 
estimem os demais através de observador de ordem reduzida. 
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9.8 Regulador linear quadrático (LQR) 


Uma lei de controle do tipo realimentação de estados muito usado na prática 
é o regulador linear quadrático (linear-quadratic regulator - LQR). 


Trata-se de um regulador para sistemas lineares em que o desempenho é ava- 
liado por uma função de custo quadrático. 


Nesse livro, o LOR é tratado através de um método de solução de problemas 
de controle ótimo. 


O resultado é surpreendente, no sentido de que a lei de controle obtida é do 
tipo realimentação de estado e que a malha fechada apresenta excelente con- 
dição de robustez. 


Considere um processo descrito pela equação de estado 
x = Ax + Bu (9.144) 


admitido ser controlável. 
A função custo é quadrática e possui uma interpretação física intuitiva. 


Se, por exemplo, a componente do sinal de controle u;(t) for uma tensão 
V(t), então V2(t) é proporcional à potência e a sua integral representa energia 
dispendida. 


Jla (.),x()] = f [tosa + [’ [x(r)Qx(r) + u(r)"Ru(7)| dr 


(9.145) 
A função de custo J em 9.145 busca estabelecer um compromisso entre tolerar 
x afastado de O ou dispender u. 


O termo x(tf)! Sx(tf) é o custo final (ou terminal) que representa uma pena- 
lidade por x(ty) não estar em O no instante final tp. 


As matrizes S e Q devem ser semidefinidas positivas e R deve ser positivo 
definida. 


O problema de controle ótimo denominado de regulador linear quadrático 
(LQR) a ser tratado consiste, portanto, em buscar uma função de controle 
u(t) que minimize o funcional de custo quadrático 


sa ato ,x(.)] (9.146) 


sujeito à restrições impostas pela dinâmica linear do sistema: 


x = Ax+Bu ;x(to)=xo (9.147) 
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Doravante, por abuso de notação, J[u (.),x(.)] será referido como J[u] e o 
controle otimizante será denotado u*, ou seja, J[u*] = minJ fu]. 


O problema LQR proposto será resolvido utilizando o método da programação 
dinâmica, proposto por (BELLMAN, 1957), embora existam outras alternati- 
vas. 

Aplicando-se o princípio da otimalidade de Belman, conforme detalhado no 
Apêndice A, a lei de controle ótimo deve satisfazer a equação de Hamilton- 
Jacobi-Bellman, dada por 


—Vi(tx) = min 5 (x Qx + u”Ru) + VZ (t,x) [Ax + Bul| (9.148) 
Vr = 5x7 8x (9.149) 


em que V(t,x) é a solução desta equação diferencial parcial. 

O valor V(0,xo) é o custo ótimo a ser atingido por u*(t). 

Inspirado na condição terminal 9.149, assume-se a mesma forma de expressão 
para um t genérico V(t,x) e verifica-se, a posteriori, se a solução obtida satis- 
faz, de fato, a equação 9.148. 


Assumindo, portanto, que 


1 
V(t,x) = zx Px (9.150) 
segue que 
VT = xT P(Ax + Bu) 
e, portanto, 
OV OV 

E ee ee 151 
Vi DE + ax (Ax + Bu) (9.151) 


= : Ea Px + x” Px + sx Px —-x]P(Ax+Bu) (9.152) 
Substituindo-se V; e V; na equação de Hamilton-Jacobi-Bellman, tem-se que 
C= i "Px + x” Px + jx Px —x?PAx — x! PBu + (9.153) 

min E (x Qx + u”Ru) +x? PAx + x"PBu (9.154) 


Uma condição necessária para o ponto de mínimo, sem restrições, é que a 
derivada em relação à variável de interesse, da função objetivo, se anule, ou 
seja, no caso, 


o 


1 
= E (x Qx + u”Ru) + x7 PAx + x"PBu =0 (9.155) 
u 
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ou 
u* = -R-1B7Px (9.156) 


ja que R é positivo definida. 


Substituindo u* em 9.154 e considerando que u* é ótimo, obtém-se, após 
simplificação, que 


xT [è + ATP + PAT - PBR'BTP +Qlx=0 (9.157) 

para x genérico, ou seja, P deve satisfazer a equação de Riccati 
-P = ATP4PA! -PBR 'B’P+Q (9.158) 
Pity) = S (9.159) 


com a condição terminal obtida por inspeção de 9.149. 
A expressão 9.158 é conhecida como a equação diferencial de Riccati. 


Constata-se que solução do problema LQR é do tipo realimentação de estados 
u(t) = —K(t)x(t) (9.160) 

em que o ganho de realimentação é dado por 
K(t) = R-'B’ P(t) (9.161) 


e P(t) satisfaz a equação de Riccati 9.158. 


Se o par (A,B) for controlável e as matrizes Q e R satisfazem as condições de 
positividade, então a equação diferencial de Riccati possui uma solução única 
P(t) e o valor de regime P e solução de 


ATP+PA! - PBR 'B’P+Q=0 (9.162) 


Uma questão relevante é a escolha das matrizes Qe R. 


Uma regra muito utilizada para ajustar os elementos dessas matrizes é a que 
foi proposta por Bryson (BRYSON; HO, 1975). 


No caso, as matrizes Q e R são consideradas diagonais e tais que 


1 

Q = (9.163) 
Ti 
1 

Rj = ma (9.164) 


em que x/”"*" e ua? são os maiores valores admissíveis (tolerados, estimados) 
de |x;(t)| e |u;|, t > 0, respectivamente. 


332 Engenharia de controle 


9.9 Margens de ganho e fase do controlador LOR 


Neste livro é tratado apenas o caso de modelos SISO, embora existam extensões 
do conceito de margens de ganho e de fase para sistemas multivariáveis. 


A obtenção das expressões para as margens de ganho e de fase requer alguns 
resultados auxiliares que estão apresentados a seguir. 
Identidade de Kalman 


A identidade de Kalman, também chamada de return difference equality, é útil 
para apresentar algumas propriedades importantes do controlador LQR. 


Considere um processo SISO-LTI descrito por 


x = Ax+Bu (9.165) 
y = Cx (9.166) 


cuja função de transferência é 


= C (sI — A) B (9.167) 


O processo será controlado em malha fechada por uma lei do tipo realimenta- 
ção de estado 
u =-Kx+v (9.168) 


em que K é projetado usando a técnica LQR. 
O índice de desempenho adotado é da forma 


Ieas f “Ce + mê) dt; p> 0 (9.169) 


e, para esse problema, sabe-se que o ganho de realimentação que minimiza 
9.169 é dado por 
K =p BTP (9.170a) 


em que P satisfaz a equação de Riccati 
ATP + PA — p !PBBTP + CTC =0 (9.171) 
Defina-se, agora, o ganho de malha 
G(s) = K (sI — A)! B (9.172) 


Conforme a figura 9.6, as funções de transferência G p(s) e Gr(s) representam, 
respectivamente, o processo em malha aberta e o ganho da malha. 
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G,(s) 


> 
X(s) fe | YO. 


Figura 9.6: Diagrama de blocos apresentando as matrizes de transferéncia 


G(s) e Gp(s). 


Nessas condições, pode-se mostrar (vide, por exemplo, (CRUZ, 1996)) que 
p [1 + Gr(s)|* [1 + Gr(s)] = p + Gp(s)*Gp(s) (9.173) 


que é conhecida como a identidade de Kalman (9.173), e, portanto, 


1 
1+Gi(gjw)P = 1+7 Gpl) (9.174) 
> 1 (9.175) 


A expressão em 9.175 significa que o vetor 
diferença [Gr(jw) — (—1)] (distância entre Im{GqGo)} 
GL(jw) e o ponto crítico —1) possui módulo 
maior ou igual a 1, conforme visualizado gra- 
ficamente na figura 9.7. 


Portanto, o ganho de Gr(s) pode variar de 
0.5 a oo, sem que a curva de Nyquist enlace 
o ponto crítico (—1). 

O atraso de fase pode ser de até 60º, como Figura 9.7: Justificativa para 


ilustrado na figura 9.7. a margem de ganho [5,00) e 
de fase de (—60º,60º) para um 


projeto LOR. 


Em outras palavras, a lei de controle obtida 
utilizando o método LQR apresenta, no caso 
SISO, uma margem de ganho de [0.5,00) e 
de fase 60º. 


Observação: 


Quando se utiliza o estado estimado X no lugar de x para implementar a lei 
de controle (ou seja, u = —KxX + v), as margem de ganho e de fase originais 
do LQR são reduzidas (DOYLE, 1978). 
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9.10 Método LQG/LTR 


Nesta seção admite-se novamente que o modelo é SISO LTI. 


Um modelo linear com (A,B) controlável pode ter os seus autovalores arbi- 
trariamente alocados mediante realimentação de estados 


u=Kx+v (9.176) 


e apresenta boas propriedades de robustez (margem de ganho de [4,00) e 


2 
margem de fase de + 60º). 


Em aplicações práticas, a medida de cada componente do estado pode ser 
custosa em face da necessidade de se dispor de vários sensores, caso em que o 
uso do estimador de estados é atraente. 


Porém, essas características são perdidas se uma estimativa x do estado é 
utilizada no lugar de x (vide (DOYLE, 1978)) 


u=—-K&+0 (9.177) 


Para mitigar esta situação, pode-se utilizar o método LTR (ou LQG/LTR, 
loop transfer recovery), que consiste em projetar, inicialmente, uma função 
de transferência alvo baseado no regulador LQR ou no filtro de Kalman (que 
possuem as boas propriedades de robustez) e, posteriormente, recuperar as 
margens de ganho e de fase, quando se utiliza a lei de controle com o estado 
observado, como em 9.177. 


A utilização do método LTR pode estar limitada por algun fatores, tais como: 
1. sistemas de fase mínima; 


2. processos quadrados (número de entradas = número de saídas) [OK para 
o caso SISO]; 


3. tendência a gerar controladores de ganho elevado. 


A apresentação desta seção é baseada no excelente material contido em (CRUZ, 
1996) e (MACIEJOWSKI, 1989). 


Assuma que um processo a ser controlado é descrito no espaço de estados por 


x = Ax+Bu (9.178) 
y = Cx (9.179) 


e cuja representação na forma de função de transferência é 


Gr(s)=C(sI-A)J!B (9.180) 
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Uma forma de obter um controlador do tipo realimentação de estados 
u = -Kx (9.181) 


é resolver o problema de minimizar o índice de desempenho quadrático 


his f ~ [aT v(t) + pu? at (9.182) 


A solução do problema de minimizar um custo do tipo quadrático 9.182 sujeito 
a restrições lineares 9.178 é da forma 9.181, em que 


K =p 'B'P (9.183) 
e P satisfaz a equação algébrica de Riccati 
PA+A!P+C'C-p !PBBÍP-O (9.184) 


Por outro lado, uma vez que o estado x não é diretamente disponível, deve-se 
estimá-lo a partir de y e u. 


Se L é o ganho do observador de estados (ou o filtro de Kalman) obtido 
utilizando-se a equação de Riccati, (KALMAN; FALB; ARBIB, 1969)), a es- 
timativa X é dada por 


Ax + Bu + L(y — 9) (9.185) 
= CR (9.186) 


- x» 


Utilizando-se o controle admitindo equivalência à certeza 


u = -KX (9.187) 

obtém-se de 9.185 que 
K = AR- BKR -LCR + Ly (9.188) 
= -KR (9.189) 


sugerindo como controlador 


Go (s) = K (sI — [A — BK — LC]) 'L (9.190) 
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Teorema fundamental do método LTR 


Considere o processo descrito por 


x = Ax+Bu (9.191) 
y = Cx (9.192) 


e cuja representação na forma de função de transferência é 
Gp (s) = C (sI — A)! B (9.193) 


Se p > 0, {A, B} é controlável, (A, C} é observável, Gp(s) é de fase mínima, 
então, utilizando-se a lei de controle 


u=—-Kx+v (9.194) 
em que 
1. K=-—p-!B?P 
2. P satisfaz 
T T 1 F 
PA +A*P+C*C— —-PBB’P=0 (9.195) 
p 


3. X é a estimativa obtida pelo observador 


K = AX—BKxX—LCX+Ly (9.196) 


tem-se que 
lim Go (s) = Gp'C(sI— A) HL (9.197) 
por 
Nota-se que o modelo do processo G'p(s) é cancelado pelo controlador Go(s), 
restando apenas C (sI — A) !L (para uma prova, ver (CRUZ, 1996)). 


Logo, o problema se reduz a buscar uma matriz L tal que C (sl — Ay L 
apresente bom desempenho. 

Uma escolha possivel para a matriz de ganhos do estimador, L, é a do filtro 
de Kalman, que é sabido possuir boas caracteristicas de robustez. 

Considere ruídos virtuais w (t) e u(t) no sistema original 


x 


Ax + Bu + Fw (9.198) 
y = Cx+v (9.199) 


em que E |w (t)] = 0, E [w (t) wT (7)| = I(t- 7), E [v (t)] = 0, E [v? (7)| = 
pd (t — T) ew; (t) L v(7) para i = 1,2,...,n 
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Observador 


assa E E ee mee eee ASS eee eee 


Figura 9.8: Diagrama de blocos do controlador LTR. 


As expressões para o filtro de Kalman correspondentes a 9.198 e 9.199 são 


x = AX+Bu+L(y-9) (9.200) 
y = Cx (9.201) 

em que 
L =| sc” (9.202) 


e S satisfaz a equação algébrica de Riccati 
AS+SAT + FF! — u“tSCTCS = 0 (9.203) 
No caso, definindo-se Gy (s) e GA(s) por 


Gy (s) = C(sI-A)'F (9.204) 
Ga (s) = C(sI—A)'L (9.205) 


tem-se, novamente, a identidade de Kalman, dado por (vide, por exemplo 
(CRUZ, 1996)) 


P Las 
[1+ Ga4(s)]° [1+ Ga(s)] =1+ ae (s) Gy (s) (9.206) 

e, portanto, recupera-se a condição de robustez visto anteriormente em 9.7. 
o ([1+G4 (jw)]) >1 (9.207) 


que pode ser utilizada para estudos de robustez da estabilidade. 


Para simplificar a análise, considera-se aqui o caso particular de sistemas de 
uma entrada e uma saida (SISO), em que 9.207 se reduz a 


J1+Ga (jw) | >21 (9.208) 
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ou seja, GA (jw) não intersecta o círculo de raio unitário com centro em (—1, 0). 


Consequentemente, GA (jw) apresenta, aproximadamente, 
MF e (-60°,60°) (9.209) 
1 
MG € 5 co) (9.210) 


recuperando, em parte, o desempenho do controlador LQR original. 


Embora a utilização de observadores de estado permita reduzir o número de 
sensores necessários para fazer a realimentação, o custo ou a disponibilidade 
de espaço podem ser inconvenientes. Nesse caso é possível utilizar estima- 
dores de estado, mas cuidando que não sejam reduzidas demais as margens 
de fase e de ganho. 


9.11 Desigualdades matriciais lineares (LMI) 


Um dos enfoques que tem recebido atenção no projeto de controladores robus- 
tos é o que envolve desigualdades matriciais lineares (linear matrix inequalities 
- LMIs). 

Em particular, será tratado o problema de robustez para incertezas ditas po- 
litópicas empregando como ferramenta de projeto as LMIs. 


Antes de definir LMIs, é conveniente que se relembre algumas definições. 


Uma função F : R” > R é dita ser afim se possuir a forma especial 


Bip). = | fo do, cm ] Rs | (9.211) 
= fot fipit fopp+: + fnPn (9.212) 
em que fo, f1,:--, fn sao constantes. 


Tem-se o caso análogo quando o domínio é o conjunto de matrizes Q = {P € 
R”*™} e a função F : R”*™ > RºX9 é da forma 


F(P) = Fo+puFi +... + PnmmEnm (9.213) 


em que F;,i = 0,...,nm são matrizes constantes e p;; são os elementos de P. 


Se F : R™™ > R'*X” é uma função afim, então uma expressão do tipo 
F(P) > 0 é chamada de desigualdade matricial linear. 
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Exemplo 1 


Considere a LMI 
Ip2 — 1p, > 0 (9.214) 


O autovalor é obtido fazendo-se 


det (A — [lp2 — 1pi]) = 0 (9.215) 

que leva a 
A= P2 — Ppi (9.216) 

Portanto, 
à > 0 < p > pı (9.217) 


e a região que satisfaz 9.214 encontra-se ilustrada à esquerda da figura 9.9. 


Exemplo 2 
Considere a LMI 


10 01 00 

É Pe o Br | > 0 (9.218) 
E d > 0 (9.219) 
pi p2 


O autovalor é obtido fazendo-se 


det (x- | E | =0 (9.220) 
Pı P2 


que leva a 
0 = X- (1+p)à+p -p (9.221) 
y= (1+ p2) + va + p2)” — 4po + Apt 
2 
Portanto, 
A>0 =} po > pt (9.222) 


e a região que satisfaz 9.219 encontra-se ilustrada no centro da figura 9.9. 
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Exemplo 3 
Considere a LMI 
1 pm po 
p 1 0|>0 (9.223) 
p O 1 
O autovalor é obtido fazendo-se 
1 p pe 
det | AI- | pi 1 0 =0 (9.224) 
p 0 1 
que leva a 
0 = (A-1) - (A-1) - (A-1) (9.225) 


0 = (A-1) a- 


)? -p3 — pi 


(1+ p2) = ya + p2)? — 4p2 + Ap? 


À = 
Portanto, um dos autovalores é 1 > 0 e 


(A— 1)? — p3 — pi 
VoD tiga ge 


A 
A 


Para se ter A > 0, 


p3 +p 


po + pi 


2 


os outros são obtidos resolvendo-se 


= 0 (9.226) 
= 0 
2+ 1/4p3 + 4p? 
7 2 
= Le 4/ pe + p? 
< 1 (9.227) 


1 


e a região que satisfaz 9.223 encontra-se ilustrada à direita da figura 9.9. 
Pode-se mostrar que uma LMI define um conjunto convexo no domínio de F, 
o que é verificado nos casos ilustrados em 9.9. 


E importante, ainda, que sistema com vários LMIs são também uma LMI, ou 


seja, o conjunto de expressões 


Fy(P) > 0; Fo(P) 


>0:..: F(P)> 0 (9.228) 
(9.229) 
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P2 P2 P2 
P: Pi P: 
> > 


Figura 9.9: As regiões descritas pelas LMI dos exemplos 1, 2 e 3. 


pode ser compactado na forma 


FP) 0 0 
0 FIP) 0 
_ |>o (9.230) 
0 oO FP) 


Os LMIs, por estarem relacionados com convexidade, dispõem de vários algo- 
ritmos numéricos muito eficientes para a obtenção de suas soluções, o que os 
torna atrativos em aplicações práticas (ver, por exemplo, (BOYD; VANDEN- 
BERGHE, 3004)). 


A seguir são apresentados alguns problemas de controle em que as soluções 
podem ser obtidas com o auxílio de LMIs. 


Exemplo de aplicação - Verificação de Estabilidade Assintótica 


Considere um sistema descrito por 
x = Ax (9.231) 


em que A € R”*”. 
Seja V(x) da forma 

V(x) =x? Px (9.232) 
que pode ser considerada função candidata de Lyapunov se P > 0. 


Como 


d 

dt 
a origem (x = 0) será assintoticamente estável se JP ER"? PT = P e tal 
que 


V (x(t)) =x" (ATP + PA) x (9.233) 


P > 0 (9.234) 
A™P+PA < 0 


342 Engenharia de controle 


Em notação mais compacta, 


P 0 


Ee = tg - (ATP + PA) 


= 0 (9.235) 


Portanto, o estudo da estabilidade assintótica foi convertido em um problema 
de verificação da viabilidade da LMI 


F(P) > O (9.236) 


Exemplo de aplicação - Verificação de estabilizabilidade 


Considere um sistema descrito por 
x = Ax + Bu (9.237) 


em que A € R?” e Be R™™. 


Assuma que se deseja obter uma matriz de realimentação de estados K, tal 
que a lei de controle u(t) = Kx(t) torna a origem estável. 


Analogamente ao caso anterior, pode-se utilizar a função candidata de Lyapu- 
nov 9.232 para o novo sistema 


x = Ax-Bu (9.238) 
= (A -BK)x (9.239) 
que resulta nas condições 
P > 0 (9.240) 
(A-BK)'P+P(A-BK) = 0 (9.241) 


Constata-se, porém, que tanto K como P são incógnitas, de modo que 9.241 
não é uma LMI por envolver o produto KTP. 


Para contornar o problema, notando que se impõe P > O (logo, não singular) 
pode-se pré e pós multiplicar a segunda desigualdade por P~', obtendo-se 


P'Í(A-BKJP+P(A-BK)|P! < 0 (9.242) 
PIA” — P-!K’B’ + AP! -BKP! < 0 
Chamando Q = P-t! eM=KP |, tem-se 


P > O (9.243) 
AQ+QA” -BM-M'B” x 0 
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Caso seja possível obter Q e M que satisfaz 


0 


F(Q,M)= | o -(AQ+QA” - BM - M’B*) 


=0 — (9.244) 


a matriz de ganhos de realimentação de estados é dada por 


K = MQ! (9.245) 


Teorema (Complemento de Schur) 
São equivalentes: 


eX>0€eZ-YX1IYT>0 
Z Y 
*X> 00] dr x [ro 


Uma vez que X é inversível, considere a matriz M não singular dada por 


I 0 
Mm | xt i (9.246) 
e note que 
Z Y Í -YX Z Y I 0 
T ao 
Mr | Yn x |M = É I RR 
= |I vxt||z-vxiy” Y 
“10 I 0 x 


(9.247) 


Z-YXIYT 0 
0 x 


9.11.1 Otimização semidefinida (OSD) 


É o problema de obter a solução P* € R"X”" que minimiza F : R”*™ 5 R, 
F(P) linear em P = [p;,;], ou seja, 


min F (P) (9.248) 
sujeito a 


F(P) =Fo+puFut...+pimFim+ -+ PniF11 +- + PnmEnm (9.249) 
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Limitante para a função custo 
Considere o modelo no espaço de estados 
x= Ax ;x(0) = xo (9.250) 


com A estável e Q = QT > 0. 
Se P é tal que 


P > 0 (9.251) 
ATP+PA+Q x 0 


então, pode-se verificar que 
OO 
| x! (t)Qx(t)dt < xP Pxo (9.252) 
0 


Portanto, garante-se um limite para o valor função custo obtido resolvendo-se 
a OSD: 
min xj Pxo (9.253) 


sujeito a 


P > 0 (9.254) 
ATP+PA+Q <= 0 


Exemplo de aplicação - Problema LQR 


Defina-se uma função de custo 


Ikare f “(oque + u”()Ru(o | at (9.255) 
e considere o problema de controle ótimo 
min J[x,u] (9.256) 
sujeito às restrições de estado 
x= Ax+Bu ;x(0) = xo (9.257) 


Sabe-se que a solução para este problema é da forma 
u(t) = -R-!B7 Px(t) (9.258) 
com P obtido como solução da equação algébrica de Riccati, 


ATP+PA-PBRIBÍP4+Q-0 (9.259) 
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O termo PBR-!B”P é do tipo quadrático, mas pode ser colocado em uma 


forma de LMI mediante a utilização do complemento de Schur: 


A™P+PA-PBR 'B’P+Q = (ATP + PA +Q)-(PB ) (R~) (B’P) 
——$5§ eee — 


Z Y x71 


levando ao LMI 
Z Y |_| ATP+PA+Q PB 

YT X| BTP R 

Portanto, o problema a ser resolvido é 
min xi Pxo 
sujeito a 
A’P+PA+Q PB sü 
BTP R 


9.11.2 Estabilidade robusta a incertezas politópicas 


O método de controle robusto a incertezas politópicas permite obter ganhos 
de realimentação para modelos paramétricos com os limites das faixas de im- 
precisão conhecidas (delimitadas por polítopos, ou poliedros, por exemplo, 


paralelepípedos no espaço de parâmetros). 


Considere o sistema 
x = Ax; A € co{A]},..., Any 


ou seja, A é uma combinação convexa de Aj, 


em que À; > 0 e tais que SM = 1. 


(9.264) 


(9.265) 


Considere a função V (x) = x” Px e note que se for possível obter P = PT > 0 


que satisfaz 


EV (x(t) =x" (ATP +PA)x <0; ¥x 40 


o sistema é estável. 


(9.266) 
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A expressão em 9.266 pode ser reescrita para x Æ O na forma 


T T 
x (A P+ PA) x 2 2 


x (È var) P+P (È val (9.267) 


N 
> Aix? (ATP + PA) (9.268) 
1=1 


em vista de 9.265. 


Logo, o sistema será estável se for possível obter P = PT > 0 tal que 


ATP+PA;<0;i=1,.,N (9.269) 


9.11.3 Realimentação de estado sob incertezas politópicas 


Considere o sistema 


x = Ax + Bu; (A,B)€eco((A,,B)),..., (An,Bn)) (9.270) 
ou seja, 
N 
(A,B) => A(A;, Bi) (9.271) 
i=1 


em que A > 0e ON, A, =1. 

Deseja-se obter K, tal que (A, B) é estável sob u = —Kx. 

Em outras palavras, os autovalores de A — BK devem estar no SPE para 
quaisquer (A, B) € co ((A1,B1),..., (Aw, By)}. 

Tome-se a função V(x) = x’ Px e note que, se for possível obter um único 
P =P” > 0 que satisfaz 


d 


av eO) =x" ((Ai — KB,)")P + P(A; — B:K)) x <0; Vx 40 


(9.272) 
para todo i = 1,..., N, então o sistema é estável. 


Em vista da existência de termos tipo PB,K, a expressão entre as parênteses 
externas de 9.272 não é uma LMI. 


Como feito anteriormente, usa-se o artifício de multiplicar ambos os lados por 
P~}, o que é possível por ter se assumido P + 0, obtendo-se 


P-' ((A; - KB;)")P + P(A; - B;K)) P™' < 0 (9.273) 
PIAT — Pp-!K’B? + AP! — B;KP™! <0 (9.274) 
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Denotando-se Q = P~! e M = KP”!, a LMI requerida é 
QA? —M’B! + A;Q-BM<=0 (9.275) 
Se a LMI é viável, obtém-se Q e M, e de M = KP™! e P = Q7! tem-se 


K = MP (9.276) 
MQ"! (9.277) 


Em vista de LMIs estarem relacionados com conjuntos convexos, existem 
vários algoritmos numéricos eficientes para o seu tratamento. Além disso, 
LMIs sao muito usados em vários problemas importantes de controle, sobre- 
maneira aqueles relacionados com robustez. 


9.12 Algumas personalidades ilustres 


O método LTR é apresentado por Huibert Kwakernaak (1937-), Optimal low- 
sensitivity linear feedback systems, e ainda em forma não explícita em Automa- 
tica, v. 5, n. 3, p. 279-285, 1969. A versão formal e explícita foi apresentada 
por John Comstock Doyle (1954-) e Gunter Stein em Doyle, J. C. e Stein G. 
Robustness with observers. IEEE Trans. Automatic Control, v. 24, p. 607- 
611, 1979. 


O filtro de Kalman foi desenvolvido por Rudolf Emil Kalman (1930-2016), pu- 
blicado em Kalman, R. E. A new approach to linear filtering and prediction 
problems. Journal of Basic Engineering, v. 82, n. 1, p. 35-45, 1960. Entre 
as várias contribuições de Kalman para a teoria de sistemas e controle, além 
do filtro estimador de estados, estão a rigorosa representação em conceituação 
de espaço de estados, noções formais de controlabilidade e observabilidade, a 
decomposição de Kalman, alguns resultados sobre controle ótimo e o algoritmo 
de Ho-Kalman para realização de modelos. 


David Gilbert Luenberger (1937-) concebeu o estimador de estados que rece- 
beu o seu nome (Luenberger, D. G. Observing the state of a linear system. 
IEEE Trans. Mil. Electron., v. MIL-8, p. 74-80, Apr. 1964). 
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Kwakernaak Doyle Kalman Luenberger 


9.13 Exercícios 


9.13.1 Exercício: Alocação de Polos 


Através de realimentação de estados, alocar todos os polos em —1. 


0 1 0 0 
x= 0 0 1|x+ 10 |u 
—6 —ll —6 1 


9.13.2 Exercício: Modelo não completamente controlavel 


Alocar, se possivel e através de realimentacao de estados, os polos em —1, —4, —5. 


0 1 0 
x= 0 0 1 | x+ Bu 
—6 —ll —6 


nos seguintes casos “diferentes atuadores”). 
T 
1. B=[1 -1 1] 
T 
2 B=[0 1 -5| 


9.13.3 Exercício: Realimentação de estados - Caso com várias entra- 
das 


Obter, se possível, a matriz de ganhos de realimentação de modo que a lei de 


controle u = —Kx + v aloca os polos em —1 multiplicidade 3. 
0 1 0 —1 1 —1 
x= 0 0 1 {x+ 1 —2 3 |u 


—6 —ll —6 —1 4 =9 
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9.13.4 Exercício: Observador de estados 


Projetar um observador de estados para o sistema descrito por 


0 0 —6 1 
x = 1 0 -l1 x+] Oļu 
0 1 —6 0 
y = | 001 | x 
sendo que o sistema deverá operar em malha fechada u = —Kx + v com o 


valor de K tal que os polos estejam alocados em —0.1 e —0.1 + 30.19. 


1. Simular o processo partindo da condição inicial x» = [1 0 0] e usando 
a lei de controle u = —Kx + v, v(t) = degrau unitário, enquanto o 
observador é inicializado com % = [0 0 0]. Apresentar os gráficos de 
x(t) xte T(t) xt. 


2. Idem ao item anterior, mas com a lei de controle u = —KX + v, em que 
x é a estimativa de x fornecida pelo observador. 


9.13.5 Exercícios: Problema LQR 


Considere um foguete cujo movimento de rotação é modelado por 
Jo=u (9.278) 


em que J é o momento de inércia e u é um torque proveniente de um par 
de jatos auxiliares formando um binário em um plano perpendicular ao eixo 
longitudinal. 


(i) Obter uma representação no espaço de estados fazendo x; = 0 e x2 = o 
sabendo-se que J = 1. 
(ii) Obter uma lei de controle u(t) tipo realimentação de estados 


u(t)=—[ ki kz | x(t) (9.279) 


que minimiza 


Tee i Lex" (t)x(t) + w2(0)] dt (9.280) 


e o parâmetro q 4 O é tal que max{ k1, k2} = 10. 
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9.13.6 Exercício: Alocação de polos e observador 


Considere um certo sistema físico cujo comportamento dinâmico é descrito 
pela equação diferencial ordinária linear e invariante no tempo: 


; 0 -2 1 

x = | EE A (9.281) 

pos O (9.282) 
Deseja-se uma lei de controle da forma u(t) = —Kx(t) +r(t), em que r(t) é um 


sinal de referência e x(t) é uma estimativa de x(t) obtida com um observador 
com os polos em -20, multiplicidade 2. 


1. 


2. 


Determinar o ganho L do observador de estados. 


Verificar a possibilidade de obter um valor de K, de modo que os auto- 
valores de A — BK estejam em —2 e —5. 


. Verificar a possibilidade de obter um valor de K, de modo que os auto- 


valores de A — BK estejam em —1 e —5. 


9.13.7 Exercícios: Realimentação de Estados Estimados 


Considere um sistema representado na forma de Brunovsky 


0 
x+]0]u (9.283) 
1 


i 


y |x (9.284) 


. Verificar se esse sistema é controlável. 


. Se for controlável, obter o ganho de realimentação K, de modo que 


u = —Kx + v aloca todos os polos do sistema em —1 (multiplicidade 3). 


. Verificar se esse sistema é observável. 


. Se for observável, projetar um observador de estados, de modo que os 


seus polos estejam localizados nas posições —5, —4 + 73. 


. Determinar a faixa de valores admissíveis de F € R, assumindo-se a uma 


lei de controle tipo realimentação da saída u(t) = Fy(t) + r(t). 
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9.13.8 Exercício: Realimentação de Estado para Sistema com Duas 
Entradas 


Considere um processo cuja dinâmica é descrita no espaço de estados por 


; 0 1 1 1 
x. = | > S| alut] | ug (9.285) 
0 1 1 1 
= | aen ay aa (9.286) 


T 
em que u = | Uy u2 | . Determinar a matriz de ganho K com a estrutura 
particular, 


1 k 
K = | i e | (9.287) 


de modo que o sistema apresente sob a lei de controle u(t) = Kx(t) + v(t), 
um sobressinal de 16.3% e tempo de pico de 3.63 s para v(t) do tipo degrau 
unitário. 


9.13.9 Exercício: Eliminação do erro de regime para entrada degrau 


Considere um certo sistema físico cujo comportamento dinâmico é descrito 
pela equação diferencial ordinária linear e invariante no tempo: 


E. 0 1 0 
x = E 6 x+ NE (9.288) 
y=[31]x (9.289) 
Deseja-se utilizar uma lei de controle da forma 
t 
u(t) = —Kx(t) + p / [r(r) — y(7T)] dr (9.290) 
0 


em que K é p são constantes de dimensões adequadas e r(t) é um sinal de 
referência conhecido. 


1. Apresentar um diagrama de blocos do sistema em malha fechada. 


2. Obter os valores de K e de p de modo que os “polos” de malha fechada 
estejam localizados em —5 (multiplicidade 3). 
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9.13.10 Exercício: Efeito do custo da variável de controle 


Considere um processo cuja função de transferência é 


G(s) = = = an (9.291) 


Obter a expressão de K (parametrizado em p) que minimiza a função de custo 


J= I le) + pu? (t)] dt (9.292) 


e estudar o efeito de variar o valor de p. Quando p > 0 tem-se o caso de cheap 
control. 


10 
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“The human spirit must prevail over technology.” 
— Albert Einstein 


Em muitas aplicações, os sinais de entrada ou de saída são modificados 
apenas em instantes discretos. 


São algumas circunstâncias em que se utiliza amostragem de sinais contínuos: 


e Tratamento digital de sinais, uma vez que se necessita de processamento 


elaborado, armazenamento de informação e atualização periódica de soft- 
ware, entre outras vantagens. 


Transmissão de dados via sinais digitais, quer seja para ter maior imu- 
nidade a ruídos ou por razões de segurança via criptografia. 


Multiplexação dos canais de comunicação e no controle remoto, sepa- 
rando sinais que requerem elevada frequência daquelas relativamente 
lentas. 


Inconveniência (ou inexistência) de sensores de tempo contínuo. Por 
exemplo, medidas que requerem auxílio de laboratório de amostras (con- 
tagem de leucócitos no sangue, medida de propriedades de materiais que 
requerem reagentes químicos, ensaios destrutivos). 


Um arranjo típico de uma arquitetura de controlador empregando um dis- 
positivo digital para sistemas de tempo contínuo (destacando-se a presença de 
conversores A/D (Analógico > Digital) e D/A (Digital + Analógico). 


A grande maioria dos processadores digitais utilizados na prática são do tipo 
síncrono (ou seja, as tarefas são organizadas temporalmente pelo sinal do re- 
lógio), como destacado na figura 10.1. 
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11100110 EE 01000110 
uipamentos 

10100101 quip 10110100 

01100001 EE 00001001 


Processador 
Digital 


Sistema LTI, 
de Tempo 
Contínuo 


Figura 10.1: Estrutura típica de controle utilizando processador digital 


Uma vez que neste texto o foco é a utilização do computador executando 
controladores digitais obtidos pela discretização de controladores analógicos, 
a entrada é preferencialmente associada ao sinal de erro e e a saída ao sinal 
de atuação u. 


Na prática, o tratamento de modelos de tempo contínuo tende a ser mais sim- 
ples que os de tempo discreto, exceto em casos como os de controle baseado em 
modelos (MPC), controle GPC, STC ou MV (Generalized Predictive Control, 
Self- Tuning Control e Minimum Variance Control), bem como na utilização 
de Filtros de Kalman (ou similar) e controladores derivados de otimização 
direta. 


10.1 Amostrador-segurador 


Em geral o sinal contínuo é primeiramente amostrado e mantido constante por 
um certo tempo (pelo segurador) até que seja completada a conversão A/D. 


e(t) 7 ealt) » PDH 


Amostrador 


sr a ty de 


i | e(t) Ordem 0 


Figura 10.2: Associação de amostrador e de segurador 
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Uma forma conveniente de modelar o efeito do amostrador tipo liga-desliga é 
utilizar em seu lugar o amostrador impulsivo. 


O amostrador impulsivo é um dispositivo idealizado que produz na sua saída 
um impulso cuja “área” é igual ao valor da sua entrada. Por exemplo, se 
e(t) = 2, então a saída é e* = 26(t). 

A figura 10.3 mostra que os sinais e(t) e u(t) dos dois arranjos mostrados à 
esquerda são os mesmos, apesar de ea (t) e e*(t) serem diferentes. 


e(t) ealt) JL 4- 
ot e*(t) 
3 “ordem 0 Tre tie 
Amostrador -= ‘ow 


(Chave) 


u(t) 
e(t) e*(t) s u(t) t 
o So 1-8 T S Fe > 
Amostrador DS DO 


Impulsivo 


Figura 10.3: Modelagem de amostrador real (relé) com segurador por um 


. . . ~ A . ap s 
amostrador impulsivo seguido de função de transferência em 


Nota-se que, quanto menor o tempo em que a chave À fica ligada, menor 
é a energia contida no sinal amostrado ea. 


Necessita-se, assim, de um dispositivo denominado de segurador (ou retentor), 
que mantém o valor do sinal amostrado entre os instantes de amostragem. 


10.2 Discretização de modelos de tempo continuo 


Um enfoque muito utilizado no prática, hoje em dia, é realizar o projeto do 
controlador no domínio de tempo contínuo e implementar a lei de controle com 
o auxílio de microcontroladores digitais. 


Nesse contexto, esta seção foca primordialmente a discretização de controla- 
dores, ou seja, dada uma relação entre sinais contínuos de entrada u e saída 
y, obter relações equivalentes de tempo discreto. 


U(s)=G(s)E(s) > U(z) = Ga(z)E(z) (10.1) 
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ou 


K=Acx+Bee |, PR a 


u = Cox ulk] = Cax[k] 


10.2.1 Discretizagao no dominio do tempo 


Considere o problema de obter um modelo de tempo discreto de um contro- 
lador com instantes de discretização kT, assumindo-se que o segurador é de 
ordem 0 e 


Acx + Bee (10.3) 
u = Cex (10.4) 


Então, dado x(kT), tem-se que 
(k+1)T 
x((k + DT) = e^Tx(kT) + J e^e(&+DT-)B c(t) dr (10.5) 
kT 


Lembrando que u(t) é constante entre kT e (k + 1)T, tem-se que 


(k+1)T 
x((k + DT) = e®Tx(kT) + f AMT dr Bee(kT) (10.6) 
kT 
A mudança de variáveis ¢ = ((k+1)T — 7), leva a d¢ = —dr, e pode-se 
escrever 


(k+1)T 0 T 
| AMT dr = — Í AC = | e^cCdt (10.7) 
kT T 0 


Substituindo-se este resultado na expressão de x((k+1)T), obtém-se o modelo 


x((k + DT) = ec? x(kT) + I à eASdé B e(kT) (10.8) 
Ag AT is = os 
Ba 


ou, usando notação para sequência, x[k + 1] = x([k + 1]T) e elk + 1] = e([k + 
1]T), tem-se 


x[k+1] = Agx{k] + Bae[k] (10.9) 
ulk] = CxÍk] (10.10) 
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Exemplo: Discretização no espaço de estados 


Seja o modelo a ser discretizado com período de amostragem T = 1s 


A | e (10.11) 


Aplicando o método que foi apresentado, 


0.600 4 0.2325 
— AT _ 
ao = | —0.4651 —0.0972 | Ena 
0.1998 
= Aly” — 
Ba ii Adc = | o | (10.13) 
e, logo, o modelo 10.11 discretizado é dado por 
0.600 4 0.2325 0.1998 
K= | —0.4651 —0.0972 | [e] | 0.2325 | [k] (10.14) 


10.2.2 Discretizagao no domínio transformado 


Considere G(s) em cascata com o modelo matemático para o amostrador- 
segurador 


u(kT) 


( 
So—o 
e(t) e“(t) st | &(t) u(t) 
j = É 
T 


Figura 10.4: Conjunto amostrador + processo a ser controlado. 


A saída E (s) do segurador pode ser expressa por 


~ 1— esT 
E(s) = ——— E*(s) (10.15) 
1- ent 
= ——— Lje] (10.16) 
Notando que 
e*(t) => e(kT)d(t — kT) (10.17) 


k=0 
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tem-se, pela definição de transformada de Laplace, 


Lew) = | es po e(kT)ó(t — kT) | dt (10.18) 
R 0 
= I e e(kT)ó(t — kT) dt (10.19) 
0 0 
= X ent) (10.20) 
0 
Logo, a expressão para E(s), e usando o fato £[5(t)] = 1, é 
E(s) = ek -kT e(kT) (10.21) 
— z e e ; 
k=0 
= 1 
= kT) — (e TT — —s(k+1)T 
> (kT) = ( ) (10.22) 


Como 1 representa degrau unitário, enquanto eTSkT e e7s(k+1)T representam 


atrasos de kT e (k + 1)T, respectivamente, 
ly ser —s(k+1)T 
e(kT)— (e — e ) 


corresponde a um pulso retangular de largura T e altura e(kT), iniciando no 
instante t = kT. 

Logo e(t) possui a forma de “escada”, como ilustrado anteriormente na figura 
10.3. 

Seja agora o problema de obter uma expressão para u(t) e denote por H (s) a 
composição cascata 


ri = Ee) (10.23) 
= HG) (10.24) 


e note que a sua entrada é um trem de impulsos. 


Como H(s) é transformada de Laplace de resposta a impulso h(t), e pela 
linearidade (ou seja, vale a superposição), a saída u é uma combinação de 
e(kT)h(kT) correspondente a cada elemento do trem de impulsos e(kT)ó(kT), 


ou seja, 
co 


u(t) = > e(kT)h(t — kT) (10.25) 
k=0 
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Amostrando-se o sinal u(t), obtém-se que 


WET) = 3 e(kT)h(€T — kT) (10.26) 
k=0 


Aplicando-se a transformada Z e usando a propriedade da convolução, resulta 


que é a relação entre ey = e(kT) e uk = u(kT) desejada. 


A função de transferência H(z) é dada, portanto, por 


h(t) 
a 
1— esT 
H(z) = Z | Lt | —— G(s) 
s 
~——Y 
H(s) 
t=kT 
Como e~*? corresponde a um atraso de 1 período de amostragem (z~!) e por 


abuso de notação (lembrar que Z é para ser aplicado a sequências) 


(s) 


As expressões ES estão tabeladas e podem ser encontradas em vários livros 
didáticos, como (CADZOW; MARTENS, 1970), (OGATA, 1970), (ASTROM; 
WITTENMARK, 1984) e (FRANKLIN; POWELL; WORKMAN, 1990). 


Exercício: 


Obter um modelo discretizado para G(s), supondo que é utilizado um segura- 
dor de ordem 0 e o período de amostragem é T 


a 
s+a 


G(s) = 


Então, pela fórmula apresentada 
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Consultando as tabelas disponíveis na literatura, 


| a | o (G-ed 
s(s+a)|  (z—1)(z—e~47) 


e, portanto, 
— e)z 
Ge) = -797 £ Ea) (10.27) 
= e (10.28) 


10.2.3 Modelos discretos de segunda ordem 


No domínio de tempo contínuo, modelos de segunda ordem são caracterizados 
por É e wn. 
2 
w 
G(s) = n 
(s) s2 + 2Ewns + w2 

Em particular, considerando a resposta degrau, dados Mp e tr desejados, po- 
dem ser obtidos os valores de € e wp tais que as especificações seja atendidas. 


Os polos desejados (no plano s) seriam, nesse caso, 


N= —bwn + j Wnif/1 — E (10.29) 


Lembrando a relação (avanço de 1 período de amostragem, versões discreta e 
contínua no tempo) 


z=e 

é possível especificar as localizações dos polos desejados no círculo unitário. 
Os lugares geométricos de € e de wn constantes (respectivamente, linhas ver- 
melha e verde) podem ser representados no círculo unitário, conforme visto na 
figura 10.5. 

Por exemplo, se o par de polos complexos estiverem na posição P da figura 
10.5, então 


€ = 0.5— Mp = 16.3 (10.30) 
0.27 
Wn = Ea (10.31) 


Se T = 0.5s, tem-se wn = 1.25rad/s que corresponde a aproximadamente 
1.9 s. Os polos podem ser alocados por métodos análogos ao caso de tempo 
contínuo, por exemplo, LGR. 
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Imaginary Axis 


-1 0.75 05 -0.25 0 0.25 0.5 
Real Axis 


0.75 1 


Figura 10.5: Círculo unitário com lugares geométricos para € e w, constantes. 


10.2.4 Discretização Aproximada 


Uma forma de discretizar um modelo (não necessa- 
riamente linear) 


x= f(x, u) (10.32) 


é aproximar a derivada (por exemplo, até a primeira 
ordem), 
x((k + DT) — x(kT) 


x 10.33 
x = (10.33) 


que leva a 


x((k + DT) — x(kT) 


7 = f(x(kT), u(kT)) 


(10.34) 


ou, por abuso de notação, x(kT) = x[k] 


x[k +1] = x[k] + T£(x[k],u[k]) (10.35) 


KT (+ 


ay+bu 


- 


Figura 10.6: Métodos 
de discretização aproxi- 
mada 
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Caso de processos LTI 


Considere um sistema escalar (x € R) descrito por 


y=ay+bu = G(s)= = 


Utilizando-se a aproximacao 


y ((k + DT) — y(kT) 


~ 
~ 


T 
para a derivada de y(t) obtém-se que 
(k+1)T 
y((R+YT) = yer) + f [ary + Ho) dr 
= y(kT) + A; 


em que A; são as áreas coloridas em amarelo na figura 10.6. 


e Aproximação A;: h = ay(kT) + bu(kT) 
A área A, = AT é dada por 


y ((k+1)T) = y(kT) + [ay(kT) + bu(kT)]T 


2Y(2) = Y(z)(1+aT)+0T 
Y(z) _ b 
U(z) z= — q 
b 


(10.36) 


(10.37) 
(10.38) 


(10.39) 
(10.40) 


(10.41) 


(10.42) 


Essa aproximação é conhecida como forward Euler e consiste em fazer 


nã z—1 
a substituição s <— SF 


e Aproximação A»: h = ay((k + 1)T) +b((k + DT) 
A área Ag = AT é dada por 


y ((k+1)T) = JkT) + [ay((k + DT) + b(u(k + 1)) ] T(10.43) 


b 


$S—a —z-1 
s= oT 


Essa aproximacao é conhecida como backward Euler. 


(10.44) 
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e Aproximação As: 


A área 43 = AT é dada por 
| ay(kT) + bu(kT) + ay((k + DT) + b(u(k + DTD) | T 


As = 
2 
e, de modo similar aos casos anteriores, 
b 
G(z) = 
S E a g=1 = 
“2241 


Esse método de aproximação é chamado de método do trapézio ou de 
Tustin. 


Observações: 


1. 


No domínio s, a região de estabilidade é o semiplano esquerdo (SPE), 
enquanto no domínio Z, é o círculo unitário. 


. Note que o método “forward Euler” (s = 2H) mapeia alguns s € SPE 


para z fora do círculo unitário. 


. Como G(z,T), é imediato obter a função de transferência quando T é 


modificado. 


. O método de Tustin altera a escala de frequências, de modo que é ne- 


cessário que se faça a correção mediante pre-warping ((LATHI, 1992), 
(FRANKLIN; POWELL; EMAMI-NAEINI, 1986)). 


. Embora não se tenha mostrado a validade do método de substituir s 


z—1 z-l 1 z—1 
Por y > zT OU ds 241 
estendido. 


para casos de x € R”, o procedimento pode ser 


Exemplo: Discretização de controlador 


Dado um problema de projeto de compensador avançador-atrasador de fase, 
realizado no domínio de tempo contínuo, deseja-se implementá-lo usando um 
microcontrolador. 


Seja então o compensador 


U(s 
Gols) = a (10.45) 
s+0.01 s+5 
= 90— DD —— 10.4 
REU s+10 |1040] 


20s? + 100.2s + 1 
— 10.47 
s2 +10.1s +1 ( 
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Figura 10.7: Mapeamento do SPE para diferentes círculos correspondentes aos 
métodos backward Euler, forward Euler e Tustin. 


ou 
101.8s + 19 
= 20 10.48 
OO. ig * eo 
Seja V(s) um termo auxiliar conforme indicado 
101.8s + 19 
= E 20E 10.49 
V(s) 


O termo auxiliar V(s) pode ser representado no espaço de estados por 


0 1 0 
x = E “oa *+ i |e (10.50) 
— 
Äg Bo 
u = |-19 -1018 |x (10.51) 
ee mm 


Co 


Aplicando-se as expressões apresentadas para discretização no espaço de esta- 
dos, 


0.9963 0.0628 

Ag = Rae a (10.52) 
0.00366 

Ba = E (10.53) 


Ca = [-19 -1018 | (10.54) 
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e, portanto, a dinâmica do controlador é descrita por u[k| = v[k] + e[k] dados 
por 


a = [0m 9m | [ 28] do oo 
ulk] = [ -19 -101.8 | x[k] + 20€[H] (10.56) 


10.3 Escolha do período de amostragem 


A escolha do período de amostragem requer cuidados de natureza teórica e 
prática. 

Será visto na sequência que, do ponto de vista teórico, a frequência de amostra- 
gem deve ser pelo menos duas vezes maior que a máxima frequência presente 
nos sinais envolvidos. 

Porém, em aplicações práticas, a frequência de amostragem deve ser significa- 
tivamente maior, uma vez que os filtros utilizados na reconstrução dos sinais 
não possuem corte abrupto e a presença de ruídos pode ser exacerbado devido 
ao fenômeno do dobramento (aliasing). 

Na figura 10.8, nos casos A e B. o sinal senoidal (linha vermelha) é adequa- 
damente reconstruído por ter sido amostrado com suficiente frequência. 


Em C a reconstituição do sinal é errônea devido à subamostragem. 


Figura 10.8: Ilustração do efeito da subamostragem. 


Recomendações: 


1. A taxa de amostragem deve ser suficiente grande para que informações 
não sejam perdidas. 
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Segundo o teorema de Shannon (Shannon, C. E. A Mathematical theory 
of communication. Bell System Technical Journal, v. 27, n. p. 623- 
666, 1958), a taxa de amostragem deve ser pelo menos duas vezes maior 
do que a maior frequência do componente constituinte do sinal original. 
Essa frequência é conhecida como a de Nyquist. 


2. Não é verdade que quanto maior a frequência de amostragem melhor. 
Frequências muito altas tendem a aumentar o erro de quantização (por 
exemplo, devido ao conversor D/A). Intuitivamente, isso ocorre porque 
muitas amostras são obtidas com o mesmo arredondamento /truncamento. 


10.4 Erros de Quantização 


Conversores A/D e D/A utilizam o código binário para representar os valores 
digitais. 

Assim, por exemplo, com 10 bits, a tensão de saída de um conversor D/A teria 
resolução de 1/1024 da tensão de referência. 

Se a tensão de referência é 10 V, a resolução seria de aproximadamente 0.01 
V. 

Os erros devidos à quantização podem ser assumidos possuir distribuição uni- 
forme, conforme ilustrado na figura 10.9, em que um sinal senoidal 1 sin(wt) 
foi quantizado em 100 níveis (ou seja, A = 0.01). 


Sinal a ser Quantizado 


Distribuição Ky an a enenenenenenges 
Uniforme H fan 


Figura 10.9: Efeito da quantização. 


O tipo de aproximação ilustrado na figura 10.9 é de truncamento com manu- 
tenção do sinal +. 


Por exemplo, se o valor da grandeza fosse +0.565, o truncamento resulta em 
+0.56 (erro = +0.565 — 0.56 = +0.005), enquanto, se fosse -0.565, ter-se-ia 
-0.56 (erro = —0.565 — (—0.56) = —0.005). 
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Para e com distribuição uniforme entre [0, A], tem-se que a média < e >= A/2 
e var(e) = A?/2. 

Ou seja, o sinal quantizado pode ser considerado como um ruído aditivo de 
distribuição uniforme de probabilidade, U(A /2, A?/2). 


Tendo-se projetado uma lei de controle no domínio do tempo contínuo, é 
comum, hoje em dia, que se utilizem controladores digitais, com a con- 
sequente necessidade de discretização. Conforme indicado ao longo deste 
capítulo, é de grande importância a escolha do período de amostragem, que 
deve ser pequeno o suficiente. Porém, é interessante notar que uma frequên- 
cia excessivamente alta não é conveniente, uma vez que exacerba o efeito da 
quantização. 


10.5 Vantagens do controle por computador 


Computadores digitais têm sido empregados em tarefas de controle automá- 
tico por apresentarem diversas vantagens em relação a sistemas baseados em 
alavancas e cames, ou circuitos elétricos, pneumáticos ou hidráulicos. 


São algumas das vantagens: 


e Possibilidade de realizar funções complexas, como tolerância a falhas, 
tratamento de sinais, decisões baseadas em inteligência artificial, super- 
visão e otimização, funções lógicas e módulos de IA, entre outras. 


e Facilidade de atualização, de diagnóstico, de comunicação remota, de re- 
gistro de dados, conexão em redes, monitoração à distância, telecomando 
e outros. 


e Portabilidade, uma vez que as interfaces dos computadores com a ins- 
trumentação de campo têm sido progressivamente padronizadas. 


e Melhoria da confiabilidade através do uso de cães de guarda (watch dogs), 
redundância de máquina, rotinas de autodiagnóstico, códigos corretores 
de erros. 


e Possibilidade de “endurecer” o hardware, através da eliminação de partes 
móveis (SSD ao invés de discos rígidos), gabinetes selados com resfria- 
mento por trocador de calor, películas anticorrosivas, blindagem eletros- 
tática, seleção de componentes de melhor qualidade, proteção contra 
surtos e curtos, entre outros. 
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e Possibilidade de usar o processo de burn-in para reduzir falhas precoces. 


e Possibilidade de aliar o processamento simbólico com o numérico (por 
exemplo, combinando expert systems com otimizadores numéricos), bem 
como aproveitando conhecimentos heurísticos do operador humano. 


e Eficácia na interação homem-máquina, através de técnicas de comunica- 
ção visual, interfaces multimídia e outras. 
Modelo do computador atuando como controlador 


A figura 10.10 apresenta como as técnicas mostradas anteriormente permitem 
relacionar o computador digital dotado de conversores A/D e D/A ao formato 
D(z)U(z). 


Computador 


y(kT) 
o—o 


et) _ e(kT) u(kT) mm u(t) y(t) y(kT) 
oo va | or Re o— Gis) | —o'o—o 
iL 


e(kT) u(kT) 1 -st | u(t) y(t) y(kT ) 
o apf apes 
E(z) U@) Ye) 


Figura 10.10: Esquema básico de controle digital. 


Exemplo de Controlador Digital: 


Considere o problema de obter D(z) para controlar o processo representado 
por 


0.1 
eis s(s + 0.1) 


de modo que Mp = 16.3%, tr < 2.5 s, sabendo-se que T = 1 s 


Método I: Projetar D(s) e discretizar 
No dominio de tempo continuo, um controlador adequado é 


s+0.1 


D(s) = 10 
o) s+1 
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AD/DA+S/H 
r(t) = y(t) (t) y(t) 
“Gia + “0 [oa em 
<h 


Aplicando-se a fórmula D(z) = (1 — 27!) 2 [Pts 


resulta a lei de controle D(z) desejada 
s+0.1 z — 0.94 


Dus — 
a a 


|] ao D(s) obtido com T =1s, 


D(s) = 10 


Método I aprimorado 


Note que o sinal amostrado e segurado, 
quando filtrado eliminando as altas frequén- Sinal 

cias, assemelha-se ao sinal original, exceto io ic 
por um atraso de a 


Sinal 
Filtrado 


Portanto, a ideia é utilizar como o modelo do 2 
processo 
0.1 T 
G( s) E e7055 g 
s(s + 0.1) Original 


Com o auxílio do MATLAB®, obteve-se o Figura 10.11: Efeito de atraso 
controlador projetado no domínio de tempo provocado pelo processo de 


contínuo amostragem 
(s + 1.11)(s + 1.25) 


D(s) = 409 CERIN 


(10.57) 


cuja versao discretizada é 


(z — 0.986)(z — 4 x 1074) 


D(z) = 409 10.58 
(2) (z — 0.45 x 10-4)2 ene) 
Método II: Discretizar primeiro o processo e trabalhar no dominio z 
Pelas especificações, C = 0.5 e wn = 1 rad/s. Logo, z = es” é dado por 
g = gundidiny1-6 (10.59) 
0.40 + 70.46 (10.60) 


Utilizando-se a ferramenta gráfica ritool do MATLAB®, obteve-se a solução 


z — 0.565 


AE E 
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10.6 Script típico de controlador 


e Passo 0: Inicializações e leitura dos parâmetros xc[0], T, r. Fazer k = 0. 


Passo 1: Verificar se alguma condição de parada do algoritmo está aten- 
dida. Se SIM, então FIM. 


Passo 2: Ler o conversor A/D, obtendo y[k] = y(t = kT). 


Passo 3: Fazer e[k] = r[k] — y[k]. 


e Passo 4: Calcular xc|k + 1] = Agxclk] + Bae[k] ouxclk + 1] = 
Flo [kl], eff). 


e Passo 5: Calcular u[k +1] = Caxc|k+ 1] ou u[k+1] = A(xclk+ 
1)). 


e Passo 5: Aguardar o instante (k + 1)T. 
e Passo 6: Aplicar u[k]. 

e Passo 7: Atualizar ro[k] + ro[k + 1] 

e Fazer k k+1. 


Passo 8: Retornar ao Passo 1. 


10.7  Mini-histórico de DDC 


O projeto do primeiro controle direto digital (direct digital control) é atribuído 
ao Imperial Chemical Industries (ICI), de Lancashire, para automatizar uma 
unidade de processamento de carbonato de sódio em 1959. O sistema de 
controle foi utilizado efetivamente em produção a partir de 1962 e operou por 
três anos. Em 1962 a unidade da Monsanto em Texas utilizando DDC entrou 
em operação antes do sistema da ICI, mas foi apenas uma avaliação por três 
meses. 
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10.8 Exercícios 


10.8.1 Exercícios: Discretização 


Obter o modelo de tempo discreto no espaço de estados, assumindo que o 
período de amostragem é T = 0.1 s: 


0 1 0 
£ o 3 | ET | u (10.61) 
po I (10.62) 


10.8.2 Exercícios: Discretização 


Considere a seguinte estrutura de um sistema amostrado. Obter a função de 


r + e 1—exp(-sT)| u y 
ts na 


transferência de malha fechada Y(z)/R(z) para os seguintes casos 


1. 1 
Gx === 
p(s) s+1 
2 9 
s+ 
CPS) a 
3. 
G = 
ee s?+2s4+1 
4. 
G Ca 
POT Bg 9 
5. 
G ya 
R s2 + 2s +2 
6. 
G(s) = : 
= s3 + 2.582 + 4s + 1.5 
7. i 
Gp(s) = 
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et 


GR s2+3s+2 


10.8.3 Exercícios: Discretização aproximada 


Obter aproximações forward Euler, backward Euler e Tustin das seguintes 
funções de transferência 


(a) i (d) i 
Ca (9) = 273552 
(b) (e) 
= Ozone 
(c) i (£) i 
C= S554 Gp(s) = Gal 


10.8.4 Exercícios: Projeto de controlador 


Considere a estrutura de malha fechada em que Gc(z) será implementada 
usando um microcontrolador digital. Escolher um período de amostragem T, 


r(t) = < ES o oe) Us) y(t) = £3 {Y(s)} 


e projetar um controlador Gc(z) de modo que o sobressinal seja de 16.6% e 


o tempo de subida t, menor que 1 s. 


10.8.5 Exercícios: Posições relativas do amostrador /segurador 


Obtenha a relação entre R(s) e U(s) 


RO) | da 5 U(s) 
ro 1- = s) + 1 = 
1 


T= 
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10.8.6 Exercícios: Controle híbrido continuo-discreto 


Onde havia um controlador proporcional K, instalou-se um integrador digital 
para operação em paralelo, com o intuito de melhorar o desempenho do pro- 
cesso, conforme a figura 10.12. 


Estudar a relação entre o sinal E(s) e U(s) 


e(kT) u(kT) 
E(s) iz U/(s) iia U(s) E 
mo. 
v, (9) 
DA E | Sao > 1 
T=1 


Figura 10.12: Instalação de um controlador digital sem desativar o controlador 
analógico utilizado anteriormente 


10.8.7 Miniprojeto de controlador digital 


Um certo processo industrial tem a sua dinâmica modelada pela equação di- 


ferencial ordinária 
i 0 1 0 
ERN m 


[21] (10.64) 


y 


e, no presente momento, encontra-se controlado em malha fechada por um PID 
analógico. No contexto da modernização da fábrica, a equipe de engenharia 
responsável por operar e manter este processo está propondo a instalação 
de um controlador digital, no lugar do controlador analógico, sem alterar os 
sensores e atuadores. 


Nesse contexto, a tarefa consiste de: 


1. Cite pelos menos cinco argumentos que poderiam ser utilizados pela 
equipe de engenharia para convencer a Diretoria de que esta moderniza- 
ção seria um bom investimento. 


2. Escolha T, o período de amostragem, a ser utilizado pelo controlador 
digital. 


3. Assumindo que o algoritmo de controle é da forma u[kT] = Kp e[kT], k € 
Z, calcule Kp de modo que, a partir do repouso e para entrada de re- 
ferência (r) do tipo degrau, tenha-se um sobressinal de 16.3 % (M, = 
0.163). 
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4. Calcule o tempo de subida (t,), supondo que se utiliza o algoritmo de 
controle do item (3). Doravante, o valor numérico deste tempo de subida 
será denotado (tORIC), 


5. Calcule o erro de regime para entrada degrau, quando se utiliza o con- 
trolador do item (3). 


6. Calcule, se possível, os ganhos (Kp e Kr) de um controlador PI de 
modo que satisfaça, segundo a sequência de prioridades, as seguintes 
especificações de desempenho: 

erro nulo de regime para entrada degrau 

sobressinal de 16.3% 

tempo de subida de 


(a 
(b 
(c 
(d 


fORIG J2 


Naa Na AN 


erro nulo de regime para entrada rampa. 


7. Projete um compensador cascata e ajuste os ganhos (Kp e Kr) do con- 
trolador PI de modo que satisfaça, segundo a sequência de prioridades, 
as seguintes especificações de desempenho: 


erro nulo de regime para entrada degrau 


sobressinal de 16.3 % 
(ORIG po 


(a 
(b 
(c 
(d 


tempo de subida de 


Set NE A ty Naa 


erro nulo de regime para entrada rampa. 


8. Apresentar, utilizando pseudocódigo, um script para o controlador PI 
do item (6), supondo que são disponíveis as rotinas 


e ON TIMER GO(tempo,'minha-subrotina'), que, quando chamado 
com o argumento tempo = [integer], gera uma interrupção após o 
tempo em ms (mili-segundos) a ser tratado pela rotina de atendi- 
mento minha-subrotina, 


e AD IN(e), que permite armazenar em e = [byte] o valor da tensão 
na entrada do conversor análogo digital no formato 8 bits (00000000 = 
—5,0V e 11111111 = +5,0V); e 


e DA OUT(u), que permite converter em tensão na faixa de —5,0 a 
+5,0V o valor armazenado em u = [byte]. 


Parte IV 


Métodos adicionais 
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Alguns Métodos Adicionais 


“He who seeks for methods without having a definite problem in mind 


seeks in the most part in vain.” 
— David Hilbert 


Neste capítulo são apresentados alguns métodos para projeto de controle de 
sistemas dinâmicos que têm recebido atenção recente. 


Foram selecionados os seguintes enfoques promissores entre aqueles disponíveis 
no momento: 


T; 


Linearização por realimentação do estado ou da saída 

Quando um modelo não linear é acurado, pode-se obter, em certos casos, 
uma transformação que o torna linear, mediante uma realimentação de 
estados ou, às vezes, mesmo da saída. 


. Controle utilizando modos deslizantes 


Trata-se de um tipo de controlador que oferece robustez a erros no mo- 
delo e perturbações exógenas, mas à custa de maior consumo de energia, 
geração de vibrações e possível aumento na velocidade de degradação 
dos atuadores. 


. Controle adaptativo com modelo de referência (MRAC) 


Aqui é feita apenas uma apresentação limitada do tema para ilustrar 
como as incertezas podem ser mitigadas pela adaptação do controlador 
às incertezas, em contraponto aos métodos baseados em robustez. 


. Controle preditivo baseado em modelos (MPC) 


Esse enfoque tem se popularizado por permitir a inclusão de restrições 
sobre a entrada, o estado e a saída, bem como por ser aplicável a sistemas 
multivariáveis. 
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5. Controle de processos que apresentam planicidade 
Embora ainda não sejam conhecidos critérios simples para verificar se 
um dado modelo é plano, o projeto do controlador é significativamente 
simplificado nesse caso. 


6. Controladores baseados em conhecimento 

A popularização de ferramentas de inteligência artificial (IA) tem per- 
mitido o desenvolvimento de controladores que incorporam capacida- 
des como a de aprendizado, decisões baseadas em realidade aumentada, 
comportamento autônomo, sensoriamento através de imagens e muitas 
outras. Aqui ilustra-se o potencial das ferramentas de IA apresentando 
controladores baseados em conhecimento expressos como regras de pro- 
dução fuzzy (Se <antecedente> então <consequente). 


11.1 Linearizagao via realimentação de estados 
O método apresentado nesta seção é aplicável a sistemas da forma 


x=f(x)+g(x)u (11.1) 


que são controláveis (novamente, u(t) € R para t fixo). 

Um teste de controlabilidade para tais modelos pode ser encontrada em (ISI- 
DORI, 1985) e (NIJMEIJER; SHAFT, 1990), entre outras referências. 
Suponha, inicialmente, que a representação de um processo esteja descrito por 
uma EDO na forma especial 


z= Az +B65 12) [u — a (Z)] (11.2) 
Nesse caso, a lei de controle 
u =a (Z) + B(z)v (11.3) 


torna linear o modelo da combinação controlador + processo 


zZ = AZ+ B67! (Z) [u -a (Z)] (11.4) 
= AZ+ B8- '(z) [a (Z) + 8(Z)u — a (z)] (11.5) 
= AZ+ Bv (11.6) 


Ainda mais, se (A,B) é controlável, então JP não singular, tal que a trans- 
formação similar 
z= PZ (11.7) 
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leva a uma representação na forma canônica controlável 


z = PAP" !z + PBU (11.8) 
eee (11.9) 
0 1 0 0 0 
0 0 1 0 0 
Z = z+ v (11.10) 
0 0 0 1 0 
—a, —ag —a3 —An 1 
Utilizando-se uma realimentação de estados v = —Kz + v é possível alocar 


todos os polos em 0 


010- 0 0 
001- 0 0 
Z= :|z+| 0 uv (11.11) 
000 1 0 
00 0 0 1 
“Ss 
Ap Bs 


Esta representação (A p, Bp) recebe o nome de forma canônica de Brunovsky 
e corresponde a se ter uma cadeia de integradores 


%2 = 2 (11.12) 

Rd = 2 (11.13) 

(11.14) 

mn = v (11.15) 
Utilizando-se v = —Kz + v e z = PZ, obtém-se que 

u = a(z)+B(z)v (11.16) 

= a(z) + (Z) (-Kz + v) (11.17) 

= a(z) + 8(z) (-KPz + v) (11.18) 

CS E 
= (a(z) — 8(@)KPz) +6(z)v (11.19) 
= a(z)+ B(z)v (11.20) 


Portanto, a representação desejada é 


Z= Apz + Bp6 (Z) [u—a(z) (11.21) 
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Assim, busca-se um mapeamento homeomórfico T : R” > R” 
z= T(x) (11.22) 
de modo que um modelo não linear (de forma muito comum na prática) 
x= f(x) + g(x)u (11.23) 


seja transformado em 11.21. 


Utilizando-se a regra da cadeia na 11.23, pode-se escrever 


Z = T(x) x (11.24) 
= Tx (x) [f(x) + eloa (11.25) 
= Tx (x)f(x) + T, (x) g(x)u (11.26) 


A ideia é obter T(.) de modo que a expressão 11.26 se torne idêntico àquela 
desejada, ou seja, a expressão 11.21, mas com A e B já na forma de Brunovsky 


Z = Apz+Bs6 (2) [u -— a (Z) (11.27) 
= ApT(x)+Bg8™ (T (x)) ju-a(T (x))]| (11.28) 
= ApT (x) + Bg8™! (x) [u— à(x)] (11.29) 


em que ã (x) = ao T(x) e B(x) = Bo T(x). 
Portanto, igualando-se os termos correspondentes de 11.26 e 11.29, tem-se que 
a transformação T (.) deve ser tal que 


Tx (x) f(x) = ApT (x) - Bb! (x) a(x) (11.30) 
Tx (x)g(x) = BS (x) (11.31) 
Denotando por T;(x) os componentes de T(x), 


Ti (x) 
To) =|: (11.32) 


AsT(x) -Bs$ !(x)a(x) = (11.33) 
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e 
Bi (x) = | Ei | (11.34) 
já que Ap possui uma forma especial 
010- 0 Tə (x) 
001 --. 0 T (x) T; (x) 
ApT(x) = |i ṣi ion i = : (11.35) 
000 1 Tn (x) Thn (X) 


© 
(em) 
j=) 
o 


bem como Bp, 


0 0 
[o] 
-Bgĝ™ (x)=- | 0 | 61) = (11.36) 
0 0 
! -F (x) 
Assim, a transformação buscada T deve satisfazer 
OT: 
i = T(x) (11.37) 
oTn-1 ns] 
dx f(x) = Tal) (11.38) 
Ta 2-1 
Sto) = 8 (x) a(x) (11.39) 
e 
OT ad eG (11.40) 
Ox 
Tn = 
Dx g(x) = 0 (11.41) 
ret) = B(x) £0 (11.42) 
Tendo-se obtido T(x), o controle linearizante é u(x) = à (x) + 8 (x) v, em que 
aTa 
ax) = -2 des, (11.43) 
F g(x) 
~ 1 
B(x) = FEIA (11.44) 


Fa B(x) 
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Em princípio, uma vez que o sistema é tornado linear por uma malha interna, 
pode-se conceber uma malha externa para alocar arbitrariamente os polos. 


Uma dificuldade do enfoque é a necessidade de se dispor de um modelo acu- 
rado. 


Figura 11.1: Linearização exata por realimentação de estado. 


11.1.1 Exemplo 


Considere o sistema descrito por 


zı = asin(x2) (11.45) 
f2 = r? +u (11.46) 


T 
em que se pode fazer a associação, denotando x = | £1 T2 ] ; 


E = kea (11.47) 


-r 
g(x) = E (11.48) 


As condições requeridas para T (x) são 


on aT; OT O} _ OT, = 
on = = OT . 
“ax (x) = Bi) Tix) = aa” sin (x2) (11.50) 
e, também, 
OT» OT» OT, 


g(x) 40 > — = —a cos (x2) £0 (11.51) 
1 


Arbitrando-se T; (x) = £1, resulta To (x) = a sin (#2), donde 


a (x1, £2) 


B (x1, £2) 


e o controle linearizante é 


u =x? + 


válido para -5 < 19 < 5. 
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Tf 3 
— a = x? (11.52) 
x 
1 1 
= 11.53 
e a cos (x2) 
1 
er (11.54) 
a cos (£2) 


De fato, utilizando-se o controle u(x1,12,v) que foi calculado, tem-se que o 
sistema, nas novas coordenadas (21,22), possui a sua dinâmica descrita por 


21 


a cos (x2) To 


U 


a cos (£2) (- 


a cos (£2) (== +r? + 


ou seja, o modelo está na forma de Brunovski 


como desejado. 


Tı (x) (11.55) 
a (11.56) 
a sin(x2) (11.57) 
To (x) (11.58) 
22 (11.59) 
(11.60) 

(11.61) 

(11.62) 

ni +u) (11.63) 

1 

=) (11.64) 

(11.65) 

= 2 (11.66) 
E id) (11.67) 
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11.2 Linearização por realimentação da saída 
Seja o modelo SISO da forma 


x = f(x) +g(x)u (11.68) 
y = h(x) (11.69) 


TO = T(x) (11.70) 
dat (x) = Ty (x) (11.71) 
a(x) = —£-!(x) a(x) (11.72) 
a g(x) = 0 (11.73) 
PT a(x) = 0 (11.74) 
ret) = AO (11.75) 


Caso favoravel: 


Em alguns casos, a própria função h(x) pode ser usada no lugar de Tı (x) 


y = ix) = Ts) (11.76) 
Derivando y, tem-se que 
. oh, 
— OT, 
A [f(x) + g(x)u] (11.78) 
= OF OT; 
= Bx TC) + “dx BU (11.79) 
e, eventualmente, 
OT = 0 (11.80) 
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Defina-se T>(x) a partir da expressão anterior de y 


OT, 


T: = ——f 11.81 
ox) = Srt) (11.81) 
= (11.82) 
Derivando-se ý = T>(x), obtém-se que 
T; 
j = on, (11.83) 
Ox 
OT» OT» 
= ——f = 11.84 
Ff) + Salen (11.84) 
e, se oP g(x) = 0, então faz-se 
OT> 
T: = Sf 11.85 
se) = ta) (11.85) 
= į (11.86) 
Prossegue-se desta forma até 
OT, OT, 
(n) ne is 11.87 
yl) = Cree) + Seo (11.87) 
Caso seja satisfeita a condição 
OT, 
SEN 0 11.88 
ax B(x) É (11.88) 
o controle linearizante é 
1 T, 
u= sr | g 2 f(x) 4 | (11.89) 
e B(x) Ox 
A saida correspondente y é tal que 
y™ =v (11.90) 
Fazendo-se z1 = y, 22=Y, .. , Zn = y™-), obtém-se a forma de Brunovsky 
FA] = RI (11.91) 
in-1 = Zn (11.92) 
in = (11.93) 
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Exemplo: Equação de Van der Pol 


Considere o seguinte modelo conhecido como o de Van der Pol controlado 


Ly = T2 (11.94) 
ta = -m+e (1 se rt) zo +u (11.95) 


Deriva-se, agora, y, até que apareça explicitamente a grandeza u 
= tı = T2 (11.97) 
j=d=-m+e(l-2)m+u (11.98) 


Logo, o controle linearizante é 
u =a —€ (1-23) T2 +V (11.99) 


de modo que 


i -sı +¢(1-a}) a2 +u (11.100) 


= -zı +e (1-27) T2 +21 -e(1- z) z2 +V (11.101) 
= v (11.102) 


De fato, fazendo-se a associação z1 = ye 22= 


21 Y> 1 =Y= 22 (11.103) 
29 yY>tz=y=v (11.104) 


Caso geral 


Suponha que o modelo é de ordem n (x/t] € R”) e assuma que, nas deriva- 
ções sucessivas de y, a variável u apareceu na r-ésima derivada ou, em outras 
palavras, 


Ma ae tuetone (11.105) 
Ox Ox 
—S>SJ>_—_’ 
#0 
parar <n. 
Um modelo 
x = f(x)+g(x)u (11.106) 


y = h(x) (11.107) 
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é dito ser de grau relativo r se 


T(x) = h(x) (11.108) 
oTk 
T; = ——f 11.109 
k+1(X) Age (x) ( ) 
oT, 
f(x) = 0;k=1,2,,,r—1 11.110 
efx) = 0; r (11.110) 
oT, 
f 0 11.111 
fx) + (11111) 
ou, equivalentemente, se u aparece explicitamente apenas em y”. 
Nesse caso, fazendo-se 
1 OT, 
u= ar | f(x) 4 | (11.112) 
Ox g(x) Ox 
pode-se obter o modelo linearizano na forma de Brunovsky 
a= 2 (11.113) 
bpd = & (11.114) 
kp =v (11.115) 
y = z% (11.116) 
Note que o modelo original é ordem n, há n — r componentes adicionais do 
estado, doravante denotados Wr+41, Wr+2; «- , Wn- 
A saída y não é afetada por esses componentes Wr+1, Wr+2, --., Wn €, logo, são 


não observáveis. 


Uma análise simplificada desses componentes não observáveis é apresentada 
no Apêndice I (Dinâmica Zero), tomando-se o caso de sistemas lineares. 


A linearização por realimentação de estado consiste essencialmente em obter 
uma transformação de coordenadas z = T(x), eventualmente não linear, e 
remete ao conceito de conjugação topológica. Para tal, a função T(x) neces- 
sita satisfazer certas condições de regularidade. Em princípio, se o modelo 
fornecido é acurado e se dispõe da transformação T, o projeto do controla- 
dor demandaria apenas técnicas lineares. No caso de realimentação da saída, 
deve-se tomar o cuidado de verificar se os componentes não observáveis são 
“estáveis”. 
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11.3 Controle utilizando movimentos deslizantes 


Ao invés de apresentar o método de controle utilizando mo- 
vimentos deslizantes em uma forma mais geral, este capí- 
tulo limita a atenção a sistemas lineares, em conformidade > A 
com a filosofia apresentada no capítulo de Introdução. Tel. 
Considere o controle de posição em apenas um eixo de um > Ik 
satélite, utilizando thrusters, que é um exemplo já visto no Figura 11.2: 
capítulo sobre controle liga-desliga. A figura ao lado ilus- 


tra o plano de movimentação em que o binário produzido 
pelos jatos de gás dos thrusters constituem a entrada u. 


Controle de saté- 
lite em um eixo 
utilizando jatos 


Assumindo ausência de arrasto, o modelo é dado por de gás. 
Jo = 4 (11.117) 
1 


em que J = 1, U (s) = £[r(t)] é uma lei de controle liga-desliga e Y (s) = L[9(t)] 
é a direção de apontamento do satélite: 


R(s)=0 + E6) 


Figura 11.3: Controle de satélite com jatos intermitentes. 


Esse sistema apresenta movimento deslizante, conforme visto na figura 11.4, 
em que propositalmente o passo de integração foi aumentado para que se 
pudesse observar o chaveamento dos jatos de gás. 


Como esse chaveamento é de elevada frequência, o comportamento observado 
devido à filtragem do componente de alta frequência é o de um sistema linear 
tipo x = —Ax. 

Esse fenômeno pode ser interpretado como um movimento de “escorregamento” 
do estado sobre uma superficie (sliding motion). 


Neste texto, além de se limitar apenas a superficies de deslizamento lineares 
passando pela origem, trabalha-se com um modelo de ordem 3 para evitar o 
emprego de numerosos indices e subíndices (a generalização para uma ordem 
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Exemplo de Movimento Deslizante 


Início do 


al i j Deslizamento ] 


Figura 11.4: Movimento deslizante apresentado pelo modelo de controle liga- 
desliga do satélite. 


qualquer é imediata, porém envolvendo uma notação mais trabalhosa). 


dy d2y dy 


TB + ay q + ag dt 


+az3y = bu+d (11.119) 


em que d é uma perturbação desconhecida a menos do seu módulo máximo 
|d| < dmaz 


Fazendo-se zı = y, T2 = ye 73 = ü, obtém-se uma realização na forma 
controlavel 
| 0 1 0 | ° [o] 
x=] 0 0 1 |x+|0lu+l0l|d (11.120) 
Las cu cm) [o) La] 


em que x = [x1 X2 x3)" 


Dado um sinal de referência y,(t) suave, deseja-se conceber um sinal de controle 
u(t) tal que y(t) —> yr(t) para t — oo. 


Defina o erro e por 
C=Yr-y (11.121) 
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e componha o vetor e = [e é é]/ em que 
e = Yr y= Yr- zT (11.122) 
è = Ùr- Ü= Ür — I (11.123) 
É = üp- ü =ü, — T3 (11.124) 


Seja também a função s definida por 


s(e) cre + coé + C3ë (11.125) 


cle (11.126) 


para alguma escolha dos coeficientes c;. 


A superfície de deslizamento S no espaço (e, é,€) que se adota aqui é um plano 
caracterizado por 


S= fe € R? | s(e)=0} (11.127) 
Se os coeficientes (c1,c2,c3) forem escolhidos de modo que as raízes de 
c3d? + A+ c, = 0 (11.128) 


tenham parte real negativa, então e(t) —> O para t — oo (com desempenho 
específico de acordo com a escolha desses coeficientes). 

Pode-se fazer uma interpretação geométrica, lembrando a expressão do pro- 
duto escalar 


s(e) = cle (11.129) 
— <cle> (11.130) 
||c|| ||el] cos(<{c, e}) (11.131) 


Portanto, s(e) = 0 significa que c L e e c é um vetor ortogonal ao plano S. 


O sinal de controle u deve ser projetado de modo que o sistema se aproxime 
de S. 


A diminuição ou o aumento de s(e) com o tempo é indicado por 
—s (e) = 2868 (11.132) 
= 2s <c|ė> (11.133) 


já que c é constante. 


Se s(e) > 0, então deve-se escolher u tal que < c | é > < 0 (ou seja, movimen- 
tar na direção de decréscimo de s(e) 
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Explicitando em termos dos componentes de é, resulta que 


Eta E E s(e) 


( ) 
= CÈ + C2ëË + C3 é ( ) 
= ci(i — £2) + c2(ğr — £3) + ca(Yr — t3) (11.136) 
= Cir + Cair + C3Y, + a3C3£1 + (a2c3 — c1) £2 ( ) 

+ (a1c3 — co) £3 + begu + des ( ) 


Note que s(e) depende de {21, £2, £3, Yr, Ür, Y}. 


Denote u fabk a parte de u que é uma realimentação de estados, visto em 11.138 
Ufdbk = — | a3c3 a2c3— cj @c3— c2] | x2 (11.139) 

e por Uref a parte correspondente ao sinal de referência yr 
Uref = — [c1 c2 c3] | Ür (11.140) 


Inicialmente, assumindo d = 0, é obtido um controle ueg que anula s(e) 
= 1 
Ueg = hes (ures + ufar) (11.141) 


Para obter å(e) < 0 quando s(e) > 0 e s(e) > 0 quando s(e) < 0, mesmo na 
presença de d não nulo, adiciona-se um termo de suficiente magnitude para 
mascará-lo 

Uslide = —M sign |s(e)] (11.142) 
com M > |d]. 


A lei de controle é dada, portanto, por 


u = ueq — M sign [s(e)] (11.143) 


Observações 


e Fase de atingimento (reaching phase): é aquela em que a evolução do 
processo ocorre distante da superfície de deslizamento, mas tentando 
atingi-la. 
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Fase de deslizamento (sliding phase): é aquela em que a evolução do 
processo ocorre sobre s = 0, ou nas proximidades, quando se adota uma 
pequena tolerância para reduzir o número de comutações. 


Em aplicações práticas, utiliza-se uma tolerância € da proximidade de e 
de S, ou seja, 


_ Jj =M ses(e)>e 
Uslide = +M se s(e) E (11.144) 
A lei de controle ustide = —M sign [s(e)|, embora mantenha s(e) = 0 du- 


rante o escorregamento, leva a infinitas comutações que ocorrem a cada 
instante. Equações diferenciais com infinitos pontos de descontinuidade 
podem ser tratados com o enfoque em (FILIPPOV, 1964). 


Exemplo numérico 


Considere o sistema descrito por 


v+6j+1ly+6y=u+d (11.145) 


Seja yr(t) = sin(t) e adote a superficie de deslizamento S caracterizado por 
s = le; + 2e2 + les. 


A expressão à? + 2s + 1 = 0 possui uma raiz dupla em —1. 


A perturbação d é assumida ser 1 + 0.2y . 


Nessas condições, tem-se que 


a=[6116] (11.146) 
c=[121] (11.147) 


O termo de realimentação u fdak é 


Ufdk = O | a3c3 (a263 = C1) (a1c3 = c2) | x (11.148) 
—6x1 = 10x2 = 4x3 (11.149) 


O termo correspondente às derivadas da referência yy é dado por 


Yr 

—]1 21) | 4, (11.150) 
Yr 

= ip rr (11.151) 


Uref 
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A lei de controle é simplesmente 
U = Ufak + Ufak — M sign l[s(e)] (11.152) 


e, no caso, se y estiver rastreando yr, então |y(t) maz| é próximo de 1. 
Como d = 1 + 0.2y, por segurança, escolheu-se M = 10. 


Movimento Deslizante 
_ Controle Utilizando Modos Deslizantes 4— 


= 05> 


Sse 
e=[00 911/48] 


o 419 


Tempo 


Figura 11.5: Resposta temporal ilustrando o bom rastreamento e a respectiva 
trajetória no espaço de erros de trastreamento 


11.3.1 Caso geral 


Para um modelo da forma 
x = f(x, u) (11.153) 


a ideia central para obter um modo deslizante é a mesma. 


Suponha que dada uma superfície desejada de deslizamento caracterizada por 
s(e) = 0 tal que 


e se s(x) > 0, então existe u = ut tal que f(x, u”) aponta na direção de 
decréscimo de s(x) 


e se s(x) < 0, então existe u = u~ tal que f(x,u”) aponta na direção de 
aumento de s(x) 


Nessas condições, desde que se possa conceber um controle Ureach que con- 
duza o sinal de erro e para uma proximidade adequada de S, o projeto de 
controlador deslizante é similar ao apresentado anteriormente. 
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Vantagens e desvantagens 


e Vantagens do controle utilizando movimentos deslizantes: 


— Redução de ordem do modelo 
— Facilidade de ajuste do desempenho 


— Robustez a incertezas 
e Desvantagens do controle utilizando movimentos deslizantes: 


— Consumo de energia (termo M sign [s(e)| sempre com a amplitude 
M,Nt) 

— Desgaste do atuador (chaveamentos bruscos) 

— Ressonância e vibração (chaveamento pode ocorrer em frequências 
indesejáveis ) 

— Dificuldade na simulação (chaveamentos de alta frequência dificul- 
tam a integração numérica). 


O controlador baseado em movimentos deslizantes pode ser projetado de 
modo a apresentar robustez, mas a comutação frequente pode diminuir a 
vida útil dos atuadores ou gerar vibrações que podem afetar o sistema. Caso 
a operação seja do tipo u(t) = +M, o atuador é de baixo custo. Quando a 
condição inicial não se encontra nas proximidades da superfície de comuta- 
ção, necessita-se de uma fase de movimento de aproximação 


11.4 Controle adaptativo 


Os modelos matemáticos podem apresentar várias incertezas que podem ad- 
vir de hipóteses simplificadoras, dispersão estatística dos parâmetros, ruídos, 
entradas exógenas negligenciadas, dinâmicas não modeladas e muitos outros 
fatores. 

Para mitigar os problemas de incertezas, os enfoques principais são de dotar 
a malha de controle com mecanismos 


1. que confiram robustez ao sistema de modo que, mesmo na presença de 
incertezas, o desempenho seja satisfatório; 


2. de adaptação para que o sistema seja modificado automaticamente para 
acomodar os desvios em relação aos dados nominais ou fazer frente a 
novas condições de operação. 
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Nesta seção é tratado o enfoque de controle adaptativo e o controle robusto 
no capítulo 9. 


Em termos gerais, os mecanismos de controle adaptativo podem ser do tipo: 


1. Direto, em que o controlador é ajustado a partir de indicadores específi- 
cos e sem a necessidade de se obter os valores dos parâmetros do modelo 
do processo. 


2. Indireto, em que os parâmetros do modelo do processo são identificados 
e os valores obtidos são inseridos em um controlador parametrizados em 
relação a esses. 


3. Programado, em que algum sinal relevante altera o comportamento do 
controlador de modo definido. Por exemplo, o controlador pode ser 
alterado de acordo com a intensidade da iluminação natural (noite,dia), 
de acordo com a altitude como no caso do aeroplano ou de acordo com 
o nível de glicemia de um paciente diabético, entre outros exemplos. 


Aqui é apresentado apenas o esquema MRAC (model reference adaptive con- 
trol), embora existam várias alternativas, como pode ser visto em (LANDAU, 
1979), (ASTROM; WITTENMARK, 1995) (NARENDRA; ANNASWAMY, 
1989) (SASTRY; BODSON, 1991) e (IOANNOU; SUN, 1996), entre outros. 


11.4.1 Controle adaptativo MRAC - Direto 


Seja a estrutura geral de um enfoque MRAC ilustrada na figura 11.6, em que 
o objetivo é ajustar dinamicamente o controlador de modo que e(t) > 0. Para 


Processo 
x=Ax+Bu 


Mecanismo 
de Adaptação 


Figura 11.6: Diagrama de blocos de uma estrutura típica de MRAC. 


simplificar a apresentação, é assumido que os modelos utilizados nesta seção 


396 Engenharia de controle 


estão na forma canônica controlável e todos os componentes do estado x estão 
disponíveis para utilização nas leis de controle e de adaptação. 


O modelo considerado é, portanto, 
x — Ax + Bu (11.154) 


em que as matrizes A, B são da forma 


0 1 0 <. 0 0 
0 1 0 0 
A=[ i poi i |a Be]: (11.155) 
0 0 0 1 0 
An =: An—2 —al 1 


As matrizes Anxn € Bnxı são consideradas constantes, porém os valores dos 
elementos são desconhecidos. 


O modelo de referência adotado, de mesmas dimensões, é expresso por 
Xm = AmXm + Bar (11.156) 


em que se assume que Am possui autovalores no semiplano esquerdo e o par 
(Am, Bm) é controlável. 


A estrutura mais simples para o controlador é a linear 
u(t) = 0i7r(t) + 0105x(t) (11.157) 


em que 0; € Re 0261 xn. 


O casamento perfeito entre o processo controlado e o modelo ocorre se 


x = Ax+Bu (11.158) 
= Ax+B (Or + 0102x) (11.159) 
(A + B0102) x + BOir (11.160) 
for idêntico a 
Xm = AmXm + Bar (11.161) 


ou seja, para os valores 07 e 03 dos parâmetros da estrutura de controle, 
atinge-se o casamento perfeito se 


Am = A+BOjo; (11.162) 
Bm = BØ (11.163) 
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Definindo-se o sinal de erro e = x — Į, somando e subtraindo o termo AmX e 
levando em conta que Bm = B0%, pode-se escrever 
é = x-Xn (11.164) 
(A + B0102) x + BOjr — Amxm — Bmr (11.165) 
= (A+ B9,05)x + BOjr — AmXm — Bmr + [Amx — Amx] 
= Am(x— xm)— (A — Am)x + B0,05x + BOjr — Br (11.166) 
~~ 
De 11.162, A — Am = —B07 035 e, logo, 
e = Ame -— B0{03x + BO) 02x + Bir — Bar (11.167) 
De 11.163, B = B,,,07, e pode-se escrever 
è = Ame -— Bm(0}) 10403x + B(07) !0105x + Bn(07) 101r — Bar 
= Ame —B,03x + Bn(07) 10102x + Bn(07) !04r — Bar (11.168) 


De 11.157, tem-se que u = 0,09x+ 047 e também r = 07 lu— 05x e, portanto, 
B,(0%) ![0,05x + 047] = By(0f) tu (11.169) 
Bar = By(01) tu — B0ox (11.170) 

e, substituindo-se esses termos na equação do erro, obtém-se 


è = Ame-Bmbjx +B, (07) tu — Bm(01) tu + B,05x(11.171) 


= Ame +Bm((0) — (0:)"')u+ Bm(82—03)x (11.172) 
y ® 
= Ame+B,Vu+ Bmx (11.173) 


Para garantir que e(t) — 0, propõe-se obter as leis de adaptação WV e O utili- 
zando a função candidata de Lyapunov 


Vie, U, 6) =e’ Pe + tr{ UU} + tr{ 675} (11.174) 
A expressão de V é 
V = Pere! Pe + 2tr{67O} +2tr (UT) (11.175) 
= (AL +u" UB], + x/67BI) Pe + 
+e! P (Ame + By, Yu + +Bm®y) + 


+2tr[67 6) + 2tr{ ww} (11.176) 
= eT (ATP +PAm)e+2[e7PBnWu +tr(bTW)) (11.177) 
eS 
-Q 


+ 2[e™PB,,dx + tr(670)] (11.178) 
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Uma vez que, por hipótese, Am possui os seus autovalores no SPE, a equação 
ATP + PA, = —Q com Q > 0 possui uma única solução P > 0, como visto 
anteriormente. 


Propondo-se a lei de adaptação 


Ë = -B1 Pex! (11.179) 
v = -Bl Peu (11.180) 


e notando que a dimensão do termo ef, „Pnxn (Bm) 
priedade tr{anx181xn} = Ba, permite escrever 


nx1 Pixn 61 X n, a pro- 


tr{b7O} = tri) (e "PBm®), } (11.181) 


1lxn 


eT PB! dx (11.182) 


De modo análogo ao que foi feito para ®, obtém-se para Y que 
try” y) =e’ PB! vu (11.183) 


Substituindo-se as expressões 11.182 e 11.183 em 11.178, constata-se que re- 
sulta 
V =-e’Qe (11.184) 


negativo semidefinida e, portanto, a origem (e, V,®) = (0,0,0) é estável. 


Nota-se, porém, que V é apenas negativo semidefinida. Assim, para ga- 
rantir que e > 0, necessita-se fazer uso do lema de Barbalat. 


Lema de Barbalat 
Segundo o lema de Barbalat (mais detalhes no Apêndice F), “dada uma função 
f(t) € Cl[a,00) tal que Jim f(t) =a, com a < ov, se f(t) for uniformemente 
00 
contínua, então lim f(t) = 0”. 
t— oo 
O lema de Barbalat é muito útil para obter resultados adicionais quando a 
função V é apenas semi-definida. 
De fato, se a função V (t) é utilizada no lugar da função f(t) do lema de Barba- 


lat, então caso V(t) seja uniformemente contínua, ter-se-á que Jim V(t) =0. 
— 00 


A função V, por sua vez, será uniformemente contínua se for possível verificar 
que V é limitada, pois uma função f(t) diferenciável e com derivada limitada 
(ou seja, f < M para algum M) é uniformemente contínua. 


O lema de Barbalat e a verificação da continuidade uniforme de V é tratada 
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no Apêndice D. 


No presente caso, a derivada temporal de V é dada por 


V(t) = -eTQe-eTQe (11.185) 
= (Ame+ By Vu + Bmx)” Qe + eTQ(Ame + 
+B,,Vu + BnPxu) (11.186) 


A condição inicial (e(0), ®(0), W(0)) é finita e, portanto, V é finita no instante 
inicial. 

Como V é negativo semidefinida, V é não crescente, e, pela estrutura de V, 
(e(t), P(t), W(t)) é finita para Vt > 0. A função |u(t)| é limitada, e, uma vez 
que 4 possui autovalores no semiplano esquerdo, o sistema de BIBO limitada, 
significando que x é limitado. 

Pelo lema de Barbalat, tem-se que V(t) — 0 e, como V é uma quadrática, 
e— 0. 


Exemplo de controle adaptativo MRAC - Direto 


Seja o modelo do processo, considerado desconhecido, dado por 


ee Giles 
Xm = | 1 eo] MP] | 


n | ù (11.187) 


Através de um controlador adaptativo tipo MRAC, deseja-se casar o modelo 
de referência 
E qu 0 1 
= —5 —10 


A entrada é u(t) = 5 sin(0.2t) e o processo é inicializado com a condição inicial 
v(0) = [2 0]”, também assumido desconhecido. 


X+ 


E | u (11.188) 


Verifica-se na figura 11.7 que a lei de controle adaptativo faz o processo se 
comportar como o modelo de referência no rastreamento do sinal de entrada. 


11.4.2 Algumas notas históricas 


e A Regra do MIT é um dos primeiros mecanismos de adaptação, apre- 
sentado em Osburn, P. V. Whitaker J.P. e Kezer, A. New developments 
in the design of model reference adaptive control systems. Institute of 
the Aerospace Sciences, MIT, artigo 61-39, jan. 1961. 
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Controle Adaptativo MRAC Direto 


20 40 60 80 100 120 140 160 180 200 
Tempo [s] 


Figura 11.7: Exemplo de controle adaptativo tipo MRAC. A resposta do pro- 
cesso controlado (linhas tracejadas) aproxima-se daquela do modelo (linhas 
cheias) 


e SOAS (textitself oscillating adaptive systems) utilizava uma estrutura 
de osciladores com relés, para construir um controlador adaptativo em 
que um processo Gp casa um modelo de referência Gm. Este enfoque foi 
utilizado no avião-foguete X-15. 


Um enfoque muito famoso aplicado a sistemas com ruídos aleatórios é 
o regulador autossintonizado (self-tuning regulator), que combina um 
identificador com uma lei de controle de variança mínima. (Astrém, K. 
J. e Wittenmark, B. On self-tuning regulators. Automatica, v. 9, n. 2, 
p. 185-199, 1973.) 


Uma excelente revisão histórica pode ser encontrada em Annaswamy, 
A. M. e Fradkov, A. L. A Historical perspective of adaptive control and 
learning, arXiv.2108.11336, Cornel University, 2022. 

https: //doi.org/10.48550/arXiv.2108.11336 


Os dois enfoques principais para mitigar o problema de incertezas empregam 
os conceitos de robustez ou adaptacao. Nesta secao apresentou-se apenas um 
método de controle adaptativo, focando leis de adaptação baseadas no crité- 
rio de estabilidade de Lyapunov. Ressalta-se, porém, que existe uma grande 
variedade de outros enfoques, por exemplo utilizando métodos de inteligên- 
cia artificial, baseados em filtragem estocástica, utilizando backstepping 
etc. 


Alguns Métodos Adicionais 401 


11.5 Controle baseado em planicidade 


A teoria sobre planicidade (flatness) é recente e envolve certa sofisticação do 
ponto de vista matemático (M. Fliess, J. L. Lévine, P. Martin and P. Rouchon: 
Flatness and defect of non-linear systems: introductory theory and examples. 
International Journal of Control, v. 61, n. 6, p. 1327-1361, 1995). 


Em termos gerais, quando se consegue descrever o modelo do processo na 
forma especial, 


x = 60,7,),5,..,7º) (11.189) 


u YPX, yY, Ñ, y") (11.190) 


então é imediato obter u a partir de x, y, y, y, etc... 


Um modelo de sistema 
x= f(x,u) x(0)= xo (11.191) 


com x € R” eu € R”, m < n, é dito ser diferencialmente plano se existe 
y = [y1, Y2,---; Ym] (saída plana) tal que 


e y,y,y,... são independentes 
e y = h(x, u, ù, ü,..., u”) 


e x e u podem ser expressos, para algum a > 0, na forma 


x= (x,y, Yy, Ý,- ..,y™) (11.192) 
u = W(x, y, ý, ï, y”) (11.193) 

É . 
p =f(p, Y) (11.194) 


Exemplo preliminar: robô móvel com tração diferencial 


Considere um robô móvel cuja velocidade linear e a direção de movimento é 
controlado pela diferença da velocidade de rotação de duas rodas, conforme 
ilustrado na figura 11.8. 


O raio de cada roda é r e as velocidades de rotação das rodas esquerda L e di- 
reita R são, respectivamente, Qr e OR. 
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O vetor velocidade é v e a velocidade angular de 
rotação em torno do centro de massa é w. 


v = (vr+vL)/2 (11.195) 
w = (vr—vi)/L (11.196) 
vr = rQpR (11.197) 
v = nt (11.198) 


Fazendo-se a associação uy = v e u2 = w, as 
equações cinemáticas do movimento são 


x 


Figura 11.8: Robô móvel 
controlado por tração dife- 
rencial 


tı = cos(x3) u (11.199) 
to = sin(x3) u (11.200) 
is = w (11.201) 
Notando que 
i? + 43 = (cos(x3)? + sin(xs)?) u (11.202) 
obtém-se que 
u = yi? ti? (11.203) 
= 4/9 +92 (11.204) 
Por outro lado, 
to — sin(@3) mr (11.205) 
Ly cos(x3) ur i 
= tan(x3 (11.206) 
Como u2 = ta, de 
23 = tan”! (=) (11.207) 
Tı 
tem-se que 
d =i £2 
= —|t ao 11.208 
uz ai | an (2) ( ) 
1 LoL, — tı t2 
= = (11.209) 
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Definindo-se como saída, y1 = £1 € Y2 = £2, tem-se que 


yoy — Yiy2 
ug = cs (11.210) 
ji + o 
Conclui-se que o modelo do robô móvel é plano, sendo que tanto u quanto x 


podem ser descritos funções de {y, ý, ¥, ..., + 


wm = yý? += Y(t, v2, Üi, Ü2) (11.211) 
yoy — yo cae ant a 
u = o = Valim, Ys 1, G2) (11.212) 
Yi t Y2 
e 
zı = yr = 1(M, ini) (11.213) 
to = yo = Golin, 92,1, 92) (11.214) 
r3 = tan! (5) = $3(%1, Vo, 1, 92) (11.215) 


Classes de sistemas com modelos planos 

Algumas classes de modelos já são sabidos serem planares: 
e Sistemas de apenas uma entrada 
e Sistemas linearizáveis por realimentação estática 


e Sistemas afins de codimensão 1 (1 entrada a menos que a dimensão do 
x): 


Sint = £(00) + Y eel) up (11.216) 
k=1 


e Sistemas mecânicos com uma entrada a menos do que as variáveis de 
configuração. 


Detalhes em: Martin P.; Murray R. M.; Rouchon P. Flat systems, HAL- 
00472051, 1997. [https://hal.archives-ouvertes.fr /hal-00472051] 
Exemplo de método de projeto de controlador 


Considere um motor DC, acionado pela armadura, cujo comportamento é 
descrito pelas equações 


Ri— Kyw+u (11.217) 


JD = Ki- Bw (11.218) 
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Adotando-se como saída y = w, verifica-se que à é função de {y, ý}: 


p aae Koi — Bw (11.219) 
dt 
1 dw 
Ee cet AB 11.22 
i K [3 A — o) ( 0) 
; 1 : 
iS K, (ut By) (11.221) 


O sistema é plano e o sinal de controle u pode ser escrito em função de y, Y, i 


a 
u = Lo + Ri+ Kw (11.222) 
Lda. R; 
= ——(Jy+B > (Jy+ By) +K 11.223 
mae 9) + 5 (Jot y) + Kaw (11.223) 
LJ. BL+RJ. RB+K,K 
= 11.224 
mit KY GR ” ( ) 
= ay + azy + azy (11.225) 
em que 
LJ BL+ RJ RB+ Kik, 
LJ. r a R 11.226 
a1 Ko , a2 Kə , a3 Kə ( ) 


Portanto, especificando-se um yref(t) desejado, pode-se determinar o sinal de 
controle u(t) requerido para que y(t) rastreie Yre f(t). 


a) Design empregando planicidade 


Adota-se para a trajetória desejada ye p(t), tal que de w(t) = O no instante 
t = 0 atinja-se w(t) = wy dado no instante t = tr especificado. Para a forma 
da resposta, escolheu-se uma curva sigmoide: 


Yref = Wre f(t) (11.227) 
3 t 
= da] [3-24 (11.228) 
Ma t 
f f 
3tet? — 24º 
= w a (11.229) 
f 


Para escrever a expressão para u, 


U = Wijref + Aref + 43Yref (11.230) 
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necessita-se de Yee e de ¥ 


d 3t,t? — 2¢8 
des = $ [o E z ) (11.231) 
itat 
= 6w (11.232) 
u 
e 
: d trt — t? 
des = (s R ) (11.233) 
tp — OF 
= Guys (11.234) 
uy 


O sistema é plano e o sinal de controle que faz y(t) rastrear y(t)ref é dado por 


LJ .. BL+RJ. RB + Kiko 
Uref = Ka ref + Kə Vref K> Yref (11.235) 
_ LIM | BL+RJ, Gia 
= K, wf E t K> W f E | 
RB+ Kks 3tyt? Soe 
| 11.236 
RB+ K,ks 3 
= 2 t 
Kot wst + 
RB+ Kk: BL+ RJ 
+13 = = E as w pt? 
aly Koty 
BL+ RJ LJ LJ 
H|I6 12 t+6 11.237 
Kot} da) WTS pah À 


A lei de controle u,ey obtida é de malha aberta e susceptível a incertezas de 
modelagem. 


Para correções em torno da resposta desejada yref (nominal), pode-se utilizar 


um controlador PID: 


t 
u = uref — Kp(yref — w) — KDYref — Kı f (Yref — w)dr (11.238) 
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b) Design empregando controle PID clássico 


Ao invés de utilizar o controlador PID para fazer correções em torno da tra- 
Jetória desejada obtida usando o conceito de planicidade, projeta-se aqui um 
controlador PID clássico para rastrear uma entrada degrau. 


Seja a referência uma função do tipo degrau com w,(t) = wy 1(t) e defina o 
sinal de erro 
e = Y-Yr (11.239) 
= ww (11.240) 
O valor de u correspondente a w = wy, em regime estacionário, é obtido a 
partir da equação de estados fazendo-se dx /dt = 0, 
—Hi — Kyu + Ureg (11.241) 
Kyi — Bw (11.242) 


A solução para esse sistema de equações é 


RB+KiK 
Ureg = ey (11.243) 


Uma lei de controle tipo PID é da forma 


t 
u = Ureg — Kp(wr — w) - Kpio — Kı | (wr — w)dr (11.244) 
0 


PID x Flatness Design 
2.5 T T T T T T 


E) 
T 


y=omega 


Flat Output 
—— PID 


Figura 11.9: Comparação entre controladores PID usando ou não planicidade. 
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A teoria que fundamenta o conceito de planicidade é matematicamente in- 
tricada e pode ser encontrado em (FLIESS et al., 1995). A vantagem é 
a possibilidade de escolher a função de saída y(t) para depois obter u(t). 
Porém, a obtenção do modelo plano pode não ser trivial e nem sempre é 
possível. 


11.6 Controle preditivo MPC 


As saídas esperadas ao se propor, no instante k, uma sequência de sinais de 
controle 


{ufk + ilk] -0,1,2 = (ulk], ulk + 1), ulk + 2], ..ulk + nul) (11.245) 


podem ser calculadas, caso se disponha de um modelo matemático. 


A ideia no controle preditivo baseado em modelos (model based predictive con- 
trol - MPC) é escolher, em cada instante k, a sequência { u[k + ilk] ki=12....n 
de acordo com um índice de desempenho definido a priori. 

Tipicamente, busca-se conciliar o erro entre uma referência desejada y e as 
saídas esperadas 7, em contraposição ao dispêndio de esforço de controle u, 
valendo-se, por exemplo, de um critério quadrático. 


= Doi + ilk] — yr) + So riulk +i- 1|k]? (11.246) 
i=1 


em que os pesos qj e ri são escolhidos pelo projetista e, usualmente, 1 < ny < 
Ny, qj >0,7;>0. 

Entre os trabalhos pioneiros em MPC estão o de Richalet et al. (1978), Model 
Predictive Heuristic Control (posteriormente chamado de Model Algorithmic 
Control (MAC)) e o de Cutler and Ramaker (1980), que se tornou conhecido 
como Dynamic Matriz Control (DMC). 

Novamente, para simplificar os detalhes da apresentação, assume-se que o 
modelo é SISO. 


Considere um modelo no espaço de estados dado por 


x[k+1] = Ax[k] + Bulk] (11.247) 
ylk+1) = Cx[k+1] (11.248) 
Se, no instante k, x[k|k] = x[k| é conhecido e forem fornecidos os valores 


ulk|k), ulk + 1|k],... , ulk + 9 — 1k], os valores futuros denotados [k + 1|k], 
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controle 


X[k + 2|k],--- , X[k + |k] podem ser obtidos recursivamente 
X[k + 1|k] = Ax[k|k] + Bulklk] (11.249) 
X[k + 2|k] = AR[k + 1|k] + Bulk + 1|k] (11.250) 
= Alx[klk] + ABulk|k] + Bulk + 1k] (11.251) 
Rik + jlk] = Afx[k|k] + A Bulk|k] + AP 2Bulk + 1k] +--+ 


+Bulk + j — 1k] (11.252) 


e, portanto, as predições até 7 passos à frente são dadas por 


glk + 1|k] 
glk + 2|k] 


glk + j|k) 


Colocando na forma 
tem-se 


= CAx{k|k] + CBulk|k] (11.253) 
= CA?x{k|k] + CABulk|k] + CBulk + 1|k] (11.254) 


= CA?x[k|k] + CA! Bulklk] +--+ 
+CBulk + j — 1k] (11.255) 


matricial e denotando o horizonte de predição por ny, 


glk + 1k] CA 
glk + 2\k] CA? 
= x[k] + 
JIk + ny|k] CA”? 
m m 
Tik] F[k] 
CB 0 --- 0 ulk|k] 
CAB CB --+ 0 ulk + 1k] 
T : : ; : f 
CA™'B CA™-?B ... CB ulk + ny — 1k] 
Sa a aaae mamaaa 
G U[k] 
(11.256) 
Assumindo a referência yp, adota-se a notação 
À = 1 1 1 q 11.257 
is | is Jen, ( ` ) 
Q = diag{q1, 42,°°* dny} (11.258) 


R = diag{ri, r2, Tna} (11.259) 
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a função custo 


ny 


= Auto glk + jk] — yr) eS rod [k + à — 1|k]? (11.260) 
i=l 


pode ser reescrita na forma compacta 
ae T sa m 
J[k] = (Fik = Y,) Q (Fik — Y,) + U[k)RU[k] (11.261) 
Uma possível restrição a ser exigida no controle é 
||ulelA]|| < umas ;£ > k (11.262) 


e, se ny < Ny, então é usual adotar Aulk + é|k] = 0 para ny < L< ny- 1. 
Substituindo 7 
Y(k] = GU[A] + F[k] (11.263) 


na expressão de J[k], resulta que 


JIk] = (GU[k] + F[k] — Y,)” Q (GU[k] + F[k] — Y.) + U[A]RU[A] 


(11.264) 
que deve ser minimizado obedecendo a restrição 
I 
| er | Uh] < Lone (11.265) 
—Luxny 
T 
em que lon, x1 = | 1 1 >- 1 Ip 


Esse problema pode ser resolvido numericamente utilizando variados algorit- 
mos de programação quadrática (vários algoritmos são apresentados em, por 
exemplo, (IZMAILOV; SOLODOV, 2005), (HIMMELBLAU, 1972), (LUEN- 
BERGER, 1973), (FLETCHER, 1986) e (BAZARAA; SHERALI; SHETTY, 
1979), entre outros) 


Embora o MPC utilize um modelo para fazer previsões do comportamento 
para uma proposta de entradas futuras, o mecanismo de horizonte retroce- 
dente permite correções em malha fechada, uma vez que a cada passo os 
resultados são recalculados. Logo, são amenizados os problemas de impreci- 
soes no modelo e perturbações exógenas. Uma vantagem do MPC é poder 
tratar restrições tais como |u(t)| < Umax, |X(t)| < maz, |y(t)| < Ymar, mas 
ao custo da necessidade de resolver um problema de otimização a cada passo. 
Apresentou-se aqui apenas a versão de tempo discreto, uma vez que a ver- 
são de tempo contínuo corresponde à necessidade de resolver problemas de 
controle ótimo. 
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11.7 Controladores inteligentes 


As ferramentas de inteligência artificial, tais como sistemas especialistas, redes 
neurais, computação evolutiva e lógica nebulosa, podem ser utilizadas para do- 
tar sistemas de controle automático de novas capacidades, como aprendizado 
autônomo, decisão na presença de incertezas e adaptação a situações inéditas, 
entre outras possibilidades. 


Aqui serão abordados apenas os controladores baseados em conhecimento tipo 
sistemas especialistas, com ou sem o uso de lógica nebulosa (fuzzy). 

As redes neurais artificiais são também muito utilizados em controle, por exem- 
plo, em problemas de aprendizado por reforço, classificação de padrões, pre- 
dição de séries temporais e identificação de modelos, entre outras aplicações 
(vide, por exemplo, (HAYKIN, 1994), (ZURADA, 1992), (CHARNIAK; MC- 
DERMOTT, 1985) e (NASCIMENTO; YONEYAMA, 2000), entre outros). 


11.7.1 Controladores baseados em conhecimento 


Muitas vezes, embora não se disponha de um modelo matemático para o pro- 
cesso, operadores humanos são capazes de realizar controle manual, com base 
em conhecimentos adquiridos com a sua experiência. 

Nestes casos, pode ser viável a representação destes conhecimentos através de 
ferramentas próprias de inteligência artificial, de modo que os operadores hu- 
manos sejam liberados de tarefas insalubres, cansativas, repetitivas ou longas. 


Além disso, os seus conhecimentos podem ser reproduzidos, armazenados e 
distribuídos a outros operadores. 


Uma forma de representar conhecimentos faz uso de regras de produção do 
tipo 
Se {condições} Então {ações} (11.266) 
Exemplos 
e Se (Temp > 150º) e (Pressão> 3atm) Então (válvula A = 40%) 
e Se (Temp > 200º) ou (Pressão> 5 atm) Então (chavel=OFF) 


e Se (Temp < 150º) e (Pressão< 2atm) Então (alarme=ON) 


Um sistema de inferência baseado em conhecimento possui, em geral, uma 
estrutura como a da figura 11.10, que, além da máquina de inferência propri- 
amente dita, possui facilidades como interface homem máquina (H/M), editor 
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de novas regras (conhecimento) e sistema de explicação para justificar as con- 
clusões obtidas. 


Entradas Saídas 


Controlador 


Parâmetros OL Medidas 


Máquina de 
Inferência 


Antecedentes 
Condições 


Consequentes 
Ações 


Base de 
Sistema de Conhecimento 


Explicação (regras) 
(dados de casos) 


Interface 
H/M 


Operador 


Editor de 
nie Conhecimento 


Figura 11.10: Arquitetura básica de um controlador baseado em conhecimento. 


11.7.2 Controladores nebulosos 


Muitas tarefas executadas por operadores humanos utilizam regras em que 
as condições e as ações são expressas de forma simbólica, através de valores 
baseados em senso comum. 


Por exemplo, um instrutor de autoescola pode sugerir ações como mais um 
pouco à direita, pise forte no freio, ande mais lento etc... 


Por outro lado, um controlador convencional estaria trabalhando com infor- 
mações do tipo posição do veículo = —0.3m, pressão nos cilindros do freio 
= 1200 psi ou velocidade < 25 km/h, etc... 


Uma vez que não parece ser adequado considerar como lenta apenas uma velo- 
cidade menor que 24.9 km/h e rápida uma de 25.01 km/h, define-se o conjunto 
nebuloso de valores de velocidade considerados lentos através de uma função 
de pertinência. 

A figura 11.11 mostra, à esquerda, um conjunto clássico (crisp) Acrisp, carac- 
terizado pela função indicadora I4, definida por 


Ia(x) = A a ; i (11.267) 
e, à direita, um conjunto nebuloso (fuzzy) Amebuloso caracterizado graficamente 
pela função de pertinência p4(x). 
No caso de conjuntos nebulosos, utiliza-se uma função ua (x) que atribui 
o grau de pertinência do ponto x ao conjunto A, como ilustrado à direita da 
figura 11.11. 


412 Engenharia de controle 


Acs: TS Anebuloso 


Figura 11.11: A esquerda um conjunto crisp com a função indicadora Ta(x) e 
à direita um conjunto fuzzy com a função de pertinência a(x). 


Funções de 
Pertinência 


Hamarelo Hjaranja 
Uyerde ' 


i Hyermelho 


Figura 11.12: Exemplo de conjuntos nebulosos em que as cores adjacentes não 
são claramente diferenciadas. 


Utilizando-se os conjuntos nebulosos, podem ser caracterizadas expressões 
como erro-grande-negativo (EG-), erro-mediano-negativo (EM-), erro-pequeno 
(EP), erro-mediano-positivo (EM+) e erro-grande-positivo (EG+). As regras 
envolvem, usualmente, condições que devem ser satisfeitas simultaneamente, 
tais como (Temperatura ALTA) E (Pressão ALTA) para ajustar a posição de 
uma válvula v. 


Na forma de regra, seria 
Se (0 é ALTA) E (p é ALTA) Então (v é PEQUENA) 


correspondendo a uTemp=ALTA(O), LPress=ALTA(P) e v = defuzzificar(v = 
PEQUENA). 


A operação defuzi ficar significa atribuir um valor numérico correspondente 
ao conjunto nebuloso v = PEQUENA. 


Uma operação típica de defuzificação encontrada com frequência é escolher a 
abscissa do centroide da área abaixo da função de pertinência uy=PEQUENA- 


As outras operações seriam OU e NÃO. 
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Funções de 
Pertinência 


Hax)  uB(x) 


Xp 
Funções de 
Pertinência 


PAD BBO) max fap) alto) 


[XK 


Xp 


Figura 11.13: Ilustração das operações intersecção (E) e união (OR) de con- 
juntos nebulosos. 


Por exemplo, se V é uma tensão e w é uma rotação, uma regra poderia ser 
Se (V é BAIXA) OU (w é NOT ALTA) Então (fé MEDIA) 


em que f poderia ser a intensidade da frenagem. 


Muitas vezes são utilizados os símbolos A para E, V para OU e — para NOT. 


A figura 11.13 mostra como são definidas as operações 
1. A A B representado por wang = min{wa(x), up(x)) 
2. A V B representado por payg = max{wa(x), up(x)} 
3. — À representado por us 4 = 1 — ualc) 


Para mais detalhes sobre inteligência artificial, especialmente sobre sistemas 
especialistas e conjuntos nebulosos, podem ser consultados livros como (RUS- 
SEL; NORVIG, 1995), (NILSSON, 1998), (KNIGHT; RICH., 2010) e (WINS- 
TON, 1992), entre os livros didáticos bem conhecidos da área. 


Inferência nebulosa 


Uma forma de inferência nebulosa com estrutura dita de Mamdani encontra- 
se ilustrada na figura 11.14 (Mamdani, E. H. Application of fuzzy algorithms 
for control of simple dynamic plant. Proc. of the IEE, v. 121, n. 12, p. 
1585-1588, 1974). 
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Ao invés de uma apresentação geral, optou-se aqui por ilustrar o processo uti- 
lizando um exemplo com apenas três regras, R1, R2 e R3 que permite uma 
visualização gráfica simples e objetiva. 

O exemplo possui duas entradas e uma saída e as regras envolvem os conecti- 
vos E e OU. 

As entradas são os sinais Temperatura e Pressão e a saída é a Abertura da 
Válvula. A Temperatura pode ser negativa (NEG), quase nula (0) e positiva 
(POS). A Pressão também podem assumir esses valores. A Abertura da Vál- 
vula pode ser FECHADA, MEDIA ou ABERTA. 


O valor numérico da Abertura da Válvula (por exemplo, 40% são obtidos como 
a abscissa do centroide da área colorida da figura 11.14). Ressalta-se que exis- 


FECHADA 


Tunes Jº iTpos Pres 4 Po Pros Vv 


Temperatura Pressão 


Abertura da Válvula 


Figura 11.14: Ilustração do mecanismo de inferência com duas entradas e três 
regras. 


tem outras estruturas para inferência nebulosa, sendo bem conhecida a de 
Takaki-Sugeno-Kang (vide, por exemplo, (SUGENO, 1985)). 


Controlador nebuloso 


O esquema de inferência nebulosa pode ser utilizado para implementação de 
controladores dinâmicos fazendo-se 


ulk] = F(ulk — 1],...,ulk — pl, elk], ...elk — al) (11.268) 


A figura 11.15 apresenta um caso simples em que u[k] = F(e[k], e[k — 1]). 
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À direita da figura 11.15 podem ser vistas as nove regras com conectivo E, ou 
seja, por exemplo, se e[k] é Médio (uem) E elk — 1] é Grande (j(e-1)G), então 
a abertura da válvula u[k] é Média (uuc). 


Para completar a descrição do controlador, deve-se ainda especificar as funções 
de pertinência u. 


elk] 
Controlador uik] Mea 
Nebuloso 
elk-1] efk-1] term 


Figura 11.15: Ilustração de um controlador nebuloso simples. 


Hp Hp Hoy 


A inteligência artificial poderá permitir dotar máquinas de algumas capa- 
cidades que o operador humano possui. Entre essas habilidades estão a 
capacidade de aprender, desenvolver novos conceitos através do raciocínio, 
manifestar proatividade nas suas tarefas, ser adaptável a situações antes não 
vistas e, enfim, possuir autonomia e poder de decisão. No momento atual 
a maioria dos sistemas dispõem de mecanismos automáticos de resposta ou 
capacidade de evolução programada, mas as expectativas para o futuro são 


grandes. 


11.8 Algumas personalidades famosas 


Roger Ware Brockett (1938-) lançou as bases para o problema de linearização 
exata por realimentação de estado (Brockett, R. W. Feedback invariants for 
nonlinear systems. In Proceedings of the International Congress of Mathema- 
ticians, Helsinki, 1978, p. 1357-1368). Os procedimentos específicos foram 
propostos em JAKUBCZYK, B. e RESPONDEK, W. On linearization of con- 
trol systems, Bull. Acad. Polonaise, Sci., Ser. Sci. Math. v. 28, p. 517-522, 
1980. 

Vadim Ivanovich Utkin (1937-) é um pioneiro na área de sistemas de estrutura 
variável e controle por modos deslizantes (Utkin, V. IO. Sliding modes and 
their applications in variable structure systems. Mir, Moscow, 1978. O pro- 
blema de equações diferenciais com discontinuidades foi tratado por Aleksei 
Fedorovich Filippov (1923-2006) (Filippov, A. F. Differential equations with 
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discontinuous right-hand side (em russo). Matematicheskii Sbornik, v. 21,n.1, 
p.99-128, 1960. 


O controle adaptativo já possui uma história relativamente longa (Control 
system with automatic response adjustment, William I. Caldwell - US Patent 
2,517,081, 1950). Mesmo o enfoque MRAC em que se busca a lei de adapta- 
ção utilizando a teoria de Lyapunov, remota à década de 1960 (Parks, P. C. - 
Lyapunov redesign of model reference adaptive control systems. IEEE TAC, 
1966, v. 11, pp. 362-7.). 


Um dos primeiros artigos mais extensos sobre sistemas planos e planicidade é 
Fliess, M.; Lévine, J.; Martin, P.; Rouchon, P. Sur les systèmes non linéaires 
différentiellement plats. C. R. Acad. Sci., v. 315, n. I, p. 619-624, 1992. 


Os trabalhos pioneiros em MPC sao: Richalet, J.; Rault, T. A.; Testud, J. 
L. e Papon, J. Model predictive heuristic control: applications to industrial 
processes. Automatica, v. 14, p. 413-428, 1978; e Cutler, C. R. e Ramaker, 
B. L. Dynamic matrix control - a computer control algorithm, Proc. Joint 
American Control Conference - IEEE, San Francisco. v. WP5-13, 1980. 


Sistemas especialistas foram introduzidos em torno de 1965 no ambito do 
Stanford Heuristic Programming Project, liderado por Edward Feigenbaum, 
reconhecido como o “pai de sistemas especialistas. Os sistemas especialistas 
pioneiros são o MYCIN, de 1975, voltado para o diagnóstico de moléstias 
infecciosas relacionadas ao sangue, INTERNIST-I de 1982 voltado a medi- 
cina interna geral e CADUCEUS de 1984 para diagnóstico médico (vide, por 
exemplo, (NILSSON, 1998)). A lógica nebulosa (fuzzy logic) foi introduzida 
por Lotfi Aliasker Zadeh em 1965 (Zadeh, L. A. Fuzzy sets, Information and 
Control, San Diego, v. 8, n. 3, p. 338-353, 1965), que posteriormente cunhou 
o termo linguistic variables. Em 1985, Seiji Yasunobu e Soji Miyamoto da 
Hitachi apresentaram simulações que mostravam a possibilidade de aplicar no 
metrô de Sendai. Em 1987, Takeshi Yamakawa utilizou a lógica nebulosa para 
controlar um pêndulo invertido. 


209m 


Fillipov Fliees Mamdani Brockett 
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11.9 Exercícios 


11.9.1 Exercício: Linearização exata por realimentação de estados 


Considere o sistema 


Ly = T2 (11.269) 
ta = «2sin(x1) — u cos(x2) (11.270) 
T 2 . é 
em que o estado x = | dy T2 ] é mensurado por instrumentos precisos. 


Obter, se possível, uma lei de controle da forma 
u(t) = a(xz1, £2) + b(£1, 22) V 


e funções T; : R? > R?, i = 1,2, de modo que, fazendo-se 


PAI = Tı (a1, £2) (11.271) 
29 = T2(21, £2) (11.272) 
obtém-se que 
à = 2 (11.273) 
io = v (11.274) 


11.9.2 Exercício: Linearização exata por realimentação de estados 


Considere um sistema de dois tanques em cas- 
cata, conforme ilustrado à direita (figura 11.16) u 


e cujas equações que descrevem as alturas xı e ' no 
x2 dos níveis de líquido dos tanques superior e | a 
inferior al 
& = 1-VIFm+u (11.275) t z 
io = vl+z—-vl+ 29 (11.276) 4 
” 


Y = do (11.277) 


Figura 11.16: Sistema de 


Obter uma transformação de variáveis z = T(x) 
tanques em cascata. 


de modo que a representação no novo sistema de 
coordenadas seja 

0 1 

0 0 


[10]z (11.279) 


Z+ 


N: 
| 


e 
II 
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11.9.3 Exercício: Linearização exata por realimentação de estados 


Obter uma transformação T : R? — R? e uma lei de controle u(t), de modo 
que o processo 


tı = —x9 +sin(x1) (11.280) 
to = —agcos(x1) + u cos(2x1) (11.281) 


seja colocada na forma canônica de Brunovsky. 


11.9.4 Exercício: Linearização exata por realimentação de estados - 


Manipulador 
Um manipulador de único elo com acoplamento flexível é descrito por 
Iq, +mgL sing, +k(q1-—q2) = 0 (11.282) 
Jq- kl- a) = 7 (11.283) 


em que I, J, m, L, k e g são constantes e 7 é a variável manipulada. 


Figura 11.17: Haste controlada por junta elástica. 


Fazendo-se a associação usual zı = q1, £2 = £1, 13 = Q2 € £4 = T3 


xr 0 
pon — (mgL sin xı + k(x1 — 13)) + 0 T 
LA j 
= (k(z1 — 23) +7) jy (mm — 8) 
O Ve ce” 
f(x) g(x) 


obter o modelo linearizado na forma de Brunovski. 
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11.9.5 Exercício: Linearização exata por realimentação de estados - 
Corpo rígido 


O movimento rotacional 3D de um corpo rígido em relação a um sistema de 
coordenadas solidário a esse é dado por 


Jia = (J2 — J3) ww + 71 (11.284) 
Jow, = (J3— Ji) ww + 72 (11.285) 
Jaws = (Jı — Jz) ww + 73 (11.286) 


em que w;, i = 1,2,3 são velocidades angulares. 


Obter o modelo linearizado na forma de Brunovski. 


11.9.6 Exercício: Linearização exata por realimentação da saída 


Estudar a linearização por realimentação da saída e a dinâmica zero dos se- 
guintes modelos: 


1. 
i = r? +ro+u (11.287) 
io = —u (11.288) 
Y = 2 (11.289) 
2. 
ii = te (11.290) 
ġo = 2103 — sin(x) (11.291) 
ia = T4 (11.292) 
ia = u (11.293) 
y =- ti (11.294) 
3. 
tı = (1+ z2)z3 + sin(z2) (11.295) 
ia = r} — 23 (11.296) 
#3 = aftu (11.297) 
ia = u (11.298) 
Yy = t (11.299) 
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11.9.7 Exercício: Controle utilizando modos deslizantes 


Para o processo abaixo, obter uma lei de controle que faça e(t) = yr(t) — 
y(t) tender a 0, à medida que t — oo, deslizando sobre a superfície e + aé = 0 


Ly = T2 (11.300) 
to = asin(x1) cos(#2) +u (11.301) 
gS! aos (11.302) 


sabendo-se que yref(t) = cos(t) e o parâmetro constante mas desconhecido a 
é tal que a € [0.8; 1.2]. 


11.9.8 Exercício: Controle utilizando movimentos deslizantes 


Considere o sistema descrito por 


Ly = T2 (11.303) 
1 

io = a(t)a? cos (x2) + qu (11.304) 

Y = t (11.305) 


em que |a(t)| <5 e o problema é rastrear um sinal y?, ou seja, obter u(t) de 
forma que y + y?” quando t — oo. 


11.9.9 Exercício: Controle robusto utilizando modos deslizantes 


Considere um processo representado no espaço de estados por 


“| sin(z1) + z2 0 
x = | ae xt], gia (11.306) 


em que os coeficientes são desconhecidos, mas tais que |a| < 2 e |b| < 5. Dada 
uma função suave y”, projetar um controlador utilizando modos deslizantes, 
de modo que y > y?. 


11.9.10 Exercício: Controle utilizando movimentos deslizantes 


Considere o sistema descrito por 


ry = T2 (11.308) 
to = a(t)a,—a22+u (11.309) 
Yy = t (11.310) 
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em que o parâmetro a(t) é desconhecido porém limitado |a(t)| < 1, Vt € R. 


Para o sinal de referência y” (t) = 2sin(t), obter uma lei de controle u(t) que 
y > y? quando t > oo. 


11.9.11 Exercício: Argumento utilizado na obtenção de MRAC 


Esse exercício revisita as tecnicalidades utilizadas para a obtenção da expressão 


para ® do esquema MRAC conforme apresentado no corpo do texto. 
Considere a equação diferencial 


@ ete |) |0 1 a | gt dj Di E 
dt e2 = —1 -l €? Po, Po 
4“ SS Re q~Yqx~ 
A & 


em que |r(t)| <Tmax, Vt > 0. 


Seja P uma matriz que satisfaz a equação algébrica 
ATP + PA =x» 


em que [5x2 é a matriz identidade 2 x 2. 


Utilizando a função candidata 
V (e,®) =e!Pe+tr(976) 

obter uma lei de adaptacao tipo 

Ë = F(e,&) 
de modo que a origem seja estável e, ainda, e > 0 quando t > oo. 
11.9.12 Exercício: Controle adaptativo de Modelo SISO 
Considere um processo unidimensional (x € R) descrito por 

t = ax + bu (11.311) 


em que a < 0 é desconhecido e b Æ 0 é também desconhecido a menos do seu 
sinal (se b > 0 ou b < 0). 


Deseja-se obter U de modo que o processo controlado case o modelo 


Em = amim + bmr (11.312) 
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Adota-se um controlador da forma 
u = Bx+0r (11.313) 


em que 0; e 05 devem ser ajustados através de uma lei de adaptação. 


Definindo-se 


e = £-Im (11.314) 
d = 6,-0 (11.315) 
p = 02-85, (11.316) 


e sabendo-se que o sinal externo r é limitado, verificar se a seguinte proposta 
para a lei de adaptação é satisfatória: 


b = —Msign(b)ez (11.317) 
= —Agsign(b) er (11.318) 
_— la bl | 
= 5845 (+90) (11.319) 


em que À; e À» são parâmetros (taxa de aprendizado ou learning rate) a serem 
ajustados pelo projetista. 


GR a | MR x _ aa 
Observação: OJ = "7 e 05 = “5,2 


11.9.13 Exercício: Planicidade 


Considere o modelo de predador-presa (por exemplo, x, pode representar ame- 
bas e o z2 as arqueobactérias), também conhecido como o de Lotka-Volterra. 
Aqui o modelo foi modificado para incluir uma variável de controle u. 


Ly = XY — @% (11.320) 
©1289 — to + U (11.321) 


To 


Considerando a saída plana y = 71, verificar que o modelo pode ser escrito na 
forma 


tı = y (11.322) 

g e (11.323) 
y 
gov y 

u= -245-245-y41 (11.324) 
y Poy 
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11.9.14 Exercício: Planicidade 


Considere a equação de Chua modificada (a equação original utiliza f(x1) não 


diferenciável que deve ser substituída por f(x1) = — 3/21. 
tj = a(x2 — 41 — f (x1) (11.325) 
to = £1 — T2 + T3 (11.326) 
t3 = —Bx+u (11.327) 


Considerando a saída plana y = z1, verificar que o modelo pode ser escrito na 
forma 


aw (11.328) 
ig = At+y+f (11.329) 
üb, 
rm = A aE (11.330) 
Q Q 
u = Erdrgrisiro(E+9+1) (11.331) 
a Q Q 


11.9.15 Exercício: Planicidade 


Considere uma haste com base rotativa atuada através de um elo elástico tipo 
mola, ilustrada na figura 11.17 modelada por 


es ae (11.332) 
L k 

i= = sin(x1) — 7 (#1 — 23) (11.333) 

i = dy (11.334) 

— bi j (11.335) 

T4 = yt T3 J : 


Obter a expressão para u(t), adotando-se como o candidato à saída plana o 
sinal Y(t) = ma (2): 
11.9.16 Exercício: Controlador MPC de 1 passo à frente 


Considere o processo unidimensional (x € R) inicialmente em repouso, descrito 
por 


alk+1) = 0.7a[k] + 0.8ulk] (11.336) 
ylk] = z[k] (11.337) 
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e o índice de desempenho a ser minimizado 
J =q (yrlk +1] — ylk +11)? + r ulk]? (11.338) 
em que a referência yr|k] = 1 para Vk > 0 e 
—1 < ufk] <1 


Fixando q = 1 determinar a solução u*[k] para r = 0.1,1 e 10. 


11.9.17 Exercício: Controlador MPC sem restrições 
Considere o processo unidimensional (x € R) inicialmente em repouso, descrito 
por 
alk+1] = 0.72[k] + 0.8u[k] (11.339) 
y[k] = z[k] (11.340) 


e o Índice de desempenho a ser minimizado 


N 
J=5 qlyrlk + i] — ylk + i)? + ruji- 1}? (11.341) 
1=1 


em que a referência yr|k] = 10 para Vk > 0, N=3,q=ler=1. 


11.9.18 Exercício: Controlador MPC incremental, sem restrições 


Considere o processo unidimensional (x € R) inicialmente em repouso, descrito 
por 


elk +1] = 0.72[k] + 0.8ulk] (11.342) 
ylk] = z[k] (11.343) 


e o Índice de desempenho a ser minimizado utilizando controle incremental, 
ou seja, ulk + 1] = u[k] + Aulk] 


N 
J=), q (yrlk + il] — ylk + i)” + r Auf+i — 1]? (11.344) 


em que a referência yr|k] = 10 para Yk > 0, N=3,g=ler=1. 


Esta estratégia penaliza Au|k] elevados (que pode desgastar mais rapidamente 
o atuador). 
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11.9.19 Exercício: Regras para inferência 


Verifique se as seguintes frases estão corretas: 


1. 


O sistema de aquisição de dados está operando normalmente. Logo, ou 
o computador master ou o seu backup está ativo. 


. Se faltar energia elétrica o equipamento para. Como o equipamento está 


parado, está havendo falta de energia. 


. Se faltar energia elétrica o equipamento para. Como o equipamento está 


operando normalmente, não há falta de energia. 


. Pão com manteiga é melhor que nada. Nada é melhor do que férias. 


Conclui-se, portanto, que Pão com manteiga é melhor que férias. 


. Para entrar na festa, o convidado deve comprar um ingresso ou trazer 1 


kg de alimento não perecível. Rasputin está na festa mas não comprou 
um ingresso. Pode-se concluir que Rasputin trouxe 1 kg de alimento não 
perecível. 


11.9.20 Exercício: Lógica elementar 


Sejam as afirmações 4 e B. 


Seja ainda a notação 


~A = não À 
AAB=AeB 
AVBAouB 

As B = se A então B 


A + B = A se e somente se B 


cujo significado pode ser encontrado na Internet ou livros de lógica elementar. 


Verificar se as seguintes proposições são verdadeiras 


1. 
2. 
3. 
4. 


AV (7A) 

(A > B) Vv (=B) 
a(+H4) 5 A 
AAB+B 
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5. AA(AB)VA 
6. —2(ANB)5 AVB 


11.9.21 Exercício: Ganho não linear 


Um controlador fuzzy estático possui as seguintes funções de pertinência para 
a entrada e e saída u. As regras utilizadas são: 
HEN Heoz Hep Hun 


e 
> 


-1 A 1 
0.4 
Figura 11.18: Ganho modelado utilizando lógica fuzzy. 


1. Se (e[t] é EQZ) Então (ult] é UZ) 
2. Se (e[t] é EN) Então (ult] é UN) 
3. Se (e[t] é EP) Então (ult] é UP) 


Lembrar que várias regras poderão estar ativas ao mesmo tempo. Esboçar a 
função u=f(e). 


11.9.22 Exercício: Controlador fuzzy 


Denota-se por HEN, HEZ € HEP as funções de pertinência correspondentes às 
condições “elk] negativo”, “elk] zero” e“elk] positivo”. Para “e[k-1]” tem-se 
de modo análogo, HEdotN; MEdotZ € HEdotP. A saída “ulk)” possui funções 
de pertinência conforme a figura 11.19. A saída “ulk|” para cada entrada 
“e[k]” e “e[k-1]” é apresentada na tabela. Esboce gráficos “(e[k],e[k-1])” versus 


“ulk]”para os casos de conectivos E e OU. 


EN EZ UP 
EdotN | UN | UN | UZ 

uf) EdotZ | UN | uz | UP 

dr  Ednp[UZ[UP | uP 


Huz Hup 


0.5 


Figura 11.19: Exercício sobre controladores fuzzy. 


Parte V 


Uma visão sistêmica de projeto 
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Alguns aspectos relevantes em 
projetos 


“Great things are not done by impulse, but by a series of small things 
brought together.” 
— Vincent Van Gogh 


Embora esta obra tenha um foco maior no tratamento teórico de controladores, 
este capítulo foi incluído para que se chame atenção a vários fatores relevantes 
no desenvolvimento prático de um sistema de controle. 

Uma proposta para organizar a apresentação das etapas de projeto de um 
sistema de controle é adaptar as recomendações da Engenharia de Sistemas. 
Entre as boas fontes de informação a respeito de Engenharia de Sistemas estão: 
(SHEA, 2020), (INCOSE, 2015) e (KOSSIAKOFF et al., 2020). 

Para efeito didático, a apresentação segue uma sequência de etapas usualmente 
utilizadas no Projeto de Sistemas de Controle, agrupadas conforme a tabela a 
seguir. 


Análise Projeto Comissionamento 
Coleta de Informações Modelagem Matemática Implementação 
Estudo do Processo Escolha do Enfoque Entrega do Produto 
Definição dos Objetivos Seleção dos Componentes  Sintonizacao Fina 
Descrição das Restrições Ajuste dos Parâmetros Operação Assistida 
Especificação de Requisitos Simulações Manutenção 
Revisão Crítica Documentação Desativação 


A tabela reflete um detalhamento simplificado das etapas de Concepção, De- 
senvolvimento, Produção, Utilização, Suporte e Desativação mencionados em 
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obras sobre Engenharia de Sistemas. 


12.1 Coleta de Informações 


O desenvolvimento de um controlador requer várias informações, além daque- 
las relacionadas ao funcionamento do processo em si. 


Apenas como exemplo, podem ser mencionados: 


Local de Operação (nos satélites, dissipar calor é um problema por estar 
no vácuo). 


Grau de segurança (nos aviões de passageiros, esse quesito é de grande 
relevância). 


Durabilidade (com o coração artificial, substituições são arriscadas). 


Limitações físicas (peso não é problema para um navio, mas sim para 
um avião). 


Custo (um robô de brinquedo muito caro vai vender pouco). 
Normas (equipamentos clínicos fora das normas não serão certificados). 


Padrões (estando fora dos padrões internacionais a manutenção será di- 
ficultada). 


Eficiência (é dificil reabastecer satélites em órbita com combustíveis). 


Manutenção e garantia (em geral, “simple is beautiful”). 


Nota-se que os vários requisitos podem ser conflitantes e impactar na viabili- 
dade do projeto. 


12.2 Estudo do processo a ser controlado 


De modo geral, “só se controla bem um processo que é bem conhecido”, e 
alguns comentários pertinentes são: 


Se o processo a ser controlado é concebido de forma concomitante com o 
controlador, há uma potencial vantagem em comparação com o caso em 
que o processo já existe e busca-se apenas agregar um controlador. Se o 
processo e o controlador são projetados de modo integrado, o desempe- 
nho de ambos pode ser favorecido em vista de uma melhor harmonização. 
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e Se o processo envolve fenômenos intrincados e complexos, poderá haver 
a necessidade de fazer aproximações que levam a modelos incertos ou 
serem afetados por variáveis exógenas de modo adverso e inesperado. 


e E de particular importância a caracterização das restrições, tanto as 
físicas quanto as operacionais, as administrativas ou as legais. Como 
exemplos, podem ser mencionados: 


1. Físicas: fim de curso de um pistão, volume do controlador, tensão 
máxima fornecida por um conversor D/A etc. 


2. Operacionais: fator de segurança para a pressão máxima em um 
vaso, utilização em ambiente hostil, segurança contra hackers etc. 


3. Administrativas: treinamento de recursos humanos, recursos finan- 
ceiros para implementação, custo das paradas não programadas, 
disponibilidade de estoque de peças etc. 


4. Legais: necessidade de certificações, atendimento a normas diversas 
etc. 


12.3 Definição dos objetivos 


Em muitos textos sobre controle de sistemas, são comuns as seguintes carac- 
terísticas de comportamento a serem exibidas pelo controlador: 


e Estabilidade: por exemplo, no caso de sistemas LTI, exigência de que 
todos os polos estejam no interior do semiplano esquerdo. 


e Rapidez: às vezes especificado através do tempo de subida para uma 
entrada tipo degrau. 


e Precisão: que pode ser eventualmente quantificada pela covariança do 
erro em regime permanente. 


e Acurácia: por vezes medido como percentual de erro em relação ao valor 
especificado da saída em regime permanente. 


e Eficiência: podendo ser o consumo médio de energia ao longo de um 
período predefinido, em operação rotineira. 


e Robustez: que pode ser representado pelas margens de ganho e de fase. 


e Tolerância a falhas: caso em que algumas falhas são compensadas por 
mecanismos de mitigação, como redundância de atuadores. 
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Na fase de especificação dos requisitos, apresentado mais à frente, são discuti- 
das as várias formas de quantificar essas características. 


12.4 Caracterização das restrições 


Em projetos práticos, deve-se atentar para algumas restrições adicionais, além 
daquelas próprias da operação do controlador. 


Podem ser mencionados, a título de exemplo, algumas restrições que são de- 
correntes de fatores como: 


Nível de vibração: veículos que trafegam em pistas irregulares. 


Máxima temperatura admissível: posicionador tipo manipulador mecá- 
nico para estufas de tratamento térmico. 


Campos eletromagnéticos: proximidade do equipamento a uma máquina 
de solda a ponto. 


Disponibilidade de Capital: Recursos financeiros limitados. 


Operação no vácuo: no robô móvel para exploração lunar não é possível 
utilizar coolers tipo ventoinha. 


Propagação de ondas eletromagnéticas para comunicação: equipamento 
de vistoria para o fundo do mar. 


Massa e Volume: mísseis antitanque pequenos lançados por soldado de- 
vem ser portáteis. 


Legislação: sustentabilidade, patentes, externalidades como a poluição, 
critérios de homologação etc. 


12.5 Especificação dos requisitos 


Além de especificações usualmente tratados em Teoria de Controle, tipo 


tr < 1 s, Mp < 20% e e(00) = 0 deve-se levar em conta para entrada 
degrau 


devem ser contemplados aspectos tais como: 


Tecnologia escolhida: cilindro hidráulico de 50.000 N — massa da bomba 
> 30 kg 


Alguns aspectos relevantes em projetos 433 


Condições ambientais: temperatura —30º a 50º e Vibração < 200 m/s? 


Condições de operação: manutenção de 6/6 meses, pureza do insumo 
> 90 % 


Disponibilidade financeira: custo menor que R$ 3.000, 00 


Normas e padrões: equipamentos clínicos — isolamento galvânico e re- 
comendação de usar equipamento ACME porque essa é a marca usada 
no resto da fábrica 


Confiabilidade: MTBF > 10.000h (mean time between failures) 


Descartabilidade: utilização de material nuclear 


12.6 Revisão crítica 


E salutar que sejam feitas revisões críticas para verificar o bom andamento do 


projeto, atendando para detalhes como: 


Consulta geral a todas as partes envolvidas. 
Aprovação do stakeholder. 


Cuidado com “esquecimentos”: uma vez o desenvolvimento já está em 
andamento, modificações das especificações de requisitos podem ter im- 
pactos sérios. 


Atualização de cronograma e marcos detalhados. 
Definição das entregas. 
Documentação. 


Participação de especialistas fora do grupo específico de trabalho. 


12.7 Modelagem matemática 


Antes da escolha do método para a obtenção de modelos matemáticos, valem 


algumas reflexões: 


Navalha de Ockham (adaptado da Wikipédia: “também chamada de 
princípio da economia, refere que a formação de hipóteses explicativas 
exige parcimônia em termos de complexidade”. 
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Lembrar sempre a frase de George E. P. Box, 1976: “All models are 
wrong, but some are useful”. 


Modelo de Projeto x Modelo de Avaliação: muitas vezes é interessante 
fazer o projeto para um modelo mais simples e avaliar o resultado em 
um modelo mais completo com ruídos, variações temporais, e não linea- 
ridades. 


Verificação Æ validação: 


— Verificação > did the things right 
— Validação — did the right thing 


Incertezas: identificação, linearização, redução da ordem de modelos e 
outros procedimentos podem introduzir incertezas. 


Modelo do Meio Ambiente: níveis de ruídos e perturbações, variabilida- 
des sazonais, erros humanos e muitos outros fatores. 


A luz dessas reflexões e das informações disponíveis, opta-se por métodos de 
caixa preta, cinza ou branca e são utilizados os procedimentos ou algoritmos 
mencionados nos capítulos de modelagem. 


12.8 Escolha do Enfoque 


A escolha da estrutura ou da classe de leis de controle a ser utilizada decorre 
do enfoque (filosofia) preferido pelo projetista. 


Off the shelf x controlador customizado: os dois tipos mais comuns de 
controladores “de prateleira” são o liga-desliga e o PID. Além de con- 
troladores PID industriais, são disponíveis equipamentos como os con- 
troladores lógicos programáveis (CLP) e os programmable automation 
controllers (PAC). 


Analítico x numérico: é muito provável, em algum momento, ter que se 
valer de métodos numéricos. No entanto, o que se destaca aqui é o cres- 
cente uso de enfoques que, de partida, envolvem extenso processamento 
numérico, como é o caso daquele baseado em redes neurais. Isso se deve 
ao fato de que, na maioria das vezes, o aprendizado de redes neurais é 
baseado em métodos de otimização numérica. 
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e Heurístico x formal: Além de métodos heurísticos famosos, como o de 
Ziegler-Nichols e o de Cohen-Coon, mecanismos heurísticos baseados em 
experiência do operador podem ser codificados com o auxílio de regras 


fuzzy. 


12.9 Seleção de componentes 


e Cada componente possui caraterísticas próprias, sendo que algumas de- 
las são tratadas em seções próprias (sensores, transdutores, atuadores e 
processadores digitais). 


e Vários componentes “baratos” redundantes x um controlador único, de 
melhor “qualidade”. Vários sensores mais simples podem ser operados 
simultaneamente e a medida ser a média entre as leituras. Além disso, 
vários sensores podem operar com redundância para mitigar o caso de 
falha de um deles. 


e Redundância heterogênea: atuadores de tipos diferentes podem operar 
em stand by, pelo menos para prover um graceful degradation no caso de 
falha do sistema principal. 


e Redundância analítica: sensores de tipos diferentes podem ter as medidas 
relacionadas por uma expressão analítica (matemática), de modo que a 
leitura de um pode ser combinado ou confrontado com outros. 


É importante ressaltar que a seleção dos diversos componentes deve ter 
sempre em vista a integração no sistema como um todo. Em particular, 
deve-se atentar para o fato que sensores, atuadores e o processador po- 
dem operar com períodos de amostragem diferentes, levando a sistemas 
multirate e problemas de sincronização. 


12.9.1 Sensores e atuadores 


e Sensor é a parte do mecanismo de medida diretamente afetado pelo fenô- 
meno que gera a grandeza a ser medida. 


e Transdutor é um dispositivo que converte um tipo de energia em outro. 
Por exemplo, energia térmica em energia elétrica (termopar). 


e No presente módulo será adotado o termo sensor para designar o dispo- 
sitivo de medida da saída. 
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Usualmente as saídas preferidas são correntes elétricas de 4 a 20 mA 
ou O a 10 V. Ainda são encontradas saídas tipo 3-15 psig em contro- 
ladores pneumáticos (interessante para uso em ambiente com produtos 
inflamáveis, não requerendo barreira intrínseca). 


Atuador é um dispositivo que ajusta a variável manipulada do sistema 
físico (bombas, motores, cilindro hidráulico, resistores de aquecimento). 


Seleção de sensores 


As escolhas dos sensores devem levar em consideração diversas características 
tais como: 


Faixa de operação (faixa de atuação, range): por exemplo, o termo- 
par Tipo K (junção Níquel-Cromo e Níquel-Alumínio) possui faixa de 
operação entre -200°C e 1200°C. Por outro lado, um termistor (NTC 
- Negative Temperature Coefficient) possui, tipicamente, uma faixa de 
operação entre -100°C e 300°C. 


Ambiente em que pode ser utilizado. Por exemplo, no vácuo, imerso em 
fluido, sob elevada vibração, sob temperaturas muito baixas etc. 


Resolução: é a menor variação da grandeza monitorada que produz uma 
variação na medida. Por exemplo, se um conversor análogo digital (A/D) 
utiliza 8 bits, para representar o valor de uma grandeza que varia de 0 a 
100 unidades, então a menor variação percebida é 100/28 = 0.3906, mas, 
se utiliza 12 bits, tem-se a resolução de 100/2!2 = 0.0244 


Precisão e exatidão (acurácia): precisão se refere ao grau de variação de 
resultados quando se realizam várias medições de uma mesma grandeza 
sob condições iguais, enquanto exatidão indica o quão próximo o valor 
medido está próximo ao valor real. Por exemplo, um sensor de desloca- 
mento linear (linear variable displacement transducer - LVDT) utilizado 
com um circuito muito ruidoso de média zero pode ser acurado na média 
de muitas leituras, mas uma leitura única pode estar bastante afastada 
do valor real. A exatidão é definida numericamente como o máximo erro 
entre o valor verdadeiro e o valor medido. A precisão se relaciona com a 
repetibilidade, em que medidas consistentes são obtidas através de múl- 
tiplas medições sob condições idênticas de ambiente e em curto espaço 
de tempo. 


Sensibilidade: o termopar Tipo K possui sensibilidade de aproximada- 
mente 41nV/ºC. Porém, se o amplificador for ruidoso e o conversor A/D 
utilizar poucos bits, a saída pode ter pouca precisão e baixa resolução. 
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Relação sinal/ruído: é importante notar que valores absolutos podem 
não representar bem o efeito do ruído. Por exemplo, um ruído de 2V em 
um sensor que monitora 220V pode ser aceitável, mas não seria adequado 
para monitorar 5V. 


Linearidade: expressa o quanto a saída y pode ser descrita por uma 
expressão do tipo y = ax em que a é uma constante. Usualmente a 
linearidade é especificada em termos da percentagem 


Linearidade = maz [Verrola) | 100% (12.1) 
TE Cin Cmax | FS 


em que Yerrol T) = Ymedido — AX e FS = A llran nce): O termo Full 
Scale representa o fundo de escala ou a faixa de variação da saída. 


Presença de deriva (ou drift) ou de viés (bias, offset): por exemplo, em 
giroscópios integradores, o ângulo indicado pode apresentar um desvio 
progressivo com o tempo (deriva), da forma O(t) = 0(0) + at, e um 
circuito eletrônico pode apresentar um erro constante (viés) devido à 
assimetria das fontes de tensão +Vic e — Vgc. 


Histerese, zona morta, folga, saturação e outras não linearidades: por 
exemplo, uma mola que não obedece à Lei de Hooke poderia ser x = 
a </f, representando um “endurecimento” ao longo do seu estiramento. 


Grau de estabilidade: às vezes o termo estabilidade é utilizado no sentido 
de que as propriedades do sensor são constantes por um longo período 
de tempo. No contexto de sensores dinâmicos, a estabilidade pode ser 
interpretada, também, de forma convencional, como no caso de se utilizar 
um pêndulo para a detecção do vertical local. 


Tempo de resposta e atraso puro: embora a aproximação assumindo res- 
posta instantânea do sensor seja adequada em muitas situações, o tempo 
de resposta pode ser não desprezível em algumas aplicações. Por exem- 
plo, um anemômetro de fio quente requer um processo de transferência 
de calor que pode ser representado por um modelo dinâmico cujo tempo 
de resposta seja significativo. 


Consumo de energia: este aspecto pode ser crucial em aplicações em 
que a fonte de energia é limitada como no caso de utilização de baterias 
(que também exigem manutenção periódica) ou que traz inconveniências 
(como a necessidade de tomadas no campo de operação, ambientes hostis, 
uso prolongado etc). 
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Custo: é sempre um fator importante, tanto no desenvolvimento quanto 
na operação e manutenção. 


Criticalidade: alguns sensores são de extrema relevância para o bom 
funcionamento da malha de controle e geralmente requerem cuidados 
especiais, tais como redundância, detecção automática de falhas, auto- 
testagem, robustez aumentada etc. 


Confiabilidade: é uma característica probabilística que indica a funcio- 
nalidade de um item por um determinado período de tempo, geralmente 
indicado pelo Mean Time Between Failures - MTBF. 


Manutenabilidade: é a caracteristica de poder ser mantido ou recolocado 
em condições de executar suas funções requeridas mediante procedimen- 
tos e meios prescritos (ABNT NBR 5462) 


Massa e volume: são características de devem ser consideradas em várias 
aplicações, como equipamentos portáteis, satélites, retrofit de sistemas 
ja existentes em que novos equipamentos não haviam sido planejados 
etc. 


Disponibilidade de mecanismos automatizados: alguns sensores podem 
ser dotados de mecanismos para autocalibração, autoteste e autoinicia- 
lização para se atingir um grau superior de dependabilidade. 


Seleção de atuadores 


Algumas características de atuadores possuem descrições semelhantes aos dos 
sensores e a adaptação é bastante intuitiva, caso em que se limita aqui um 
detalhamento mais elaborado. As escolhas dos atuadores devem considerar 
características tais como: 


e Capacidade de carga: por exemplo, no caso de motor de passos, se a 


carga supera um valor máximo (geralmente especificado pelo fabricante), 
ocorre o stall, ou seja, o rotor não consegue avançar para o próximo passo 


(step). 


e Tipo de alimentação (pneumática, elétrica, hidráulica). 


e Consumo e eficiência: enquanto os sensores possuem um consumo ge- 


ralmente baixo e de pouca variação (a menos, por exemplo, que utilize 
reagentes consumíveis), os transdutores geralmente demandam energia, 
que, em algumas aplicações, pode ser bastante custosa. Por exemplo, no 
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controle de órbitas de satélites, podem ser utilizados foguetes de propul- 
são, mas, uma vez que o combustível é consumido, o reabastecimento é 
proibitivo. 


Exatidão, Precisão, Resolução, Linearidade, Repetibilidade, Deriva, Viés, 
Estabilidade, Histerese, Atritos Seco, Folga de Engrenagem, Durabili- 
dade, Custo, Confiabilidade, Manutenabilidade, Massa e Volume: esses 
conceitos são similares àqueles apresentados para os sensores, porém re- 
lacionando a ação do atuador em relação aos valores comandados. 


Velocidade de resposta sob cargas variadas: muitas vezes a carga a ser 
manipulada afeta a dinâmica do atuador. Por exemplo, no caso de um 
motor elétrico, o transitório depende de fatores como o momento de inér- 
cia e do atrito viscoso da carga, podendo haver inclusive efeitos dinâmicos 
adicionais como a elasticidade do eixo de acionamento. 


Processador digital 


Com os avanços conquistados no campo da tecnologia digital, os sistemas mo- 
dernos de aquisição de dados são, frequentemente, baseados em processadores 
digitais. 


A utilização de processadores digitais pode ser tornada mais segura utilizando 
cuidados específicos, tais como 


Uso de watchdog timer (cão de guarda) para reinicializar algoritmos ou 
softwares em caso de erros. 


Uso de códigos corretores de erros. 
Burn in para evitar falha precoce dos componentes. 


Uso de compartimentos selados com temperatura controlada, preferenci- 
almente com uso de trocadores de calor ao invés de ventoinhas e também 
blindagem eletromagnética. 


Eliminação de soquetes e conectores para evitar mau contato devido a 
fadiga por vibração. 


Uso de componentes endurecidos (por exemplo, com encapsulamento 
especial). 


Utilização de warm backup. 


Algumas considerações adicionais constam do capítulo que trata o pro- 
blema de controle por computador. 
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12.10 Ajuste dos parâmetros 


Embora em alguns casos mais simples o ajuste dos parâmetros do controlador 
possa ser realizado através de tentativa e erro, de modo geral, é mais eficaz o 
uso de métodos analíticos ou numéricos assistido por computador. 


São exemplos de métodos de ajuste de parâmetros de controlador 


e Métodos gráficos (com ou sem o auxílio do computador), como os que 
se valem do LGR, curvas de Bode, cartas de Nichols etc. 


e Busca numérica, quer seja utilizando algoritmo de otimização ou de satis- 
fação de restrições. Um método não muito elegante, mas que é utilizado 
com alguma frequência, é o da busca em grade. Se os parâmetros são 
p E [Pmin; Pmaz| € q E [Amin Imax], divide-se o retângulo com uma grade, 
por exemplo, 10 x 10, e testa-se cada (pj, q;). 


e Métodos heurísticos que, dependendo das informações disponíveis, po- 
dem evitar a necessidade de tentativa e erro. Por exemplo, o método de 
Ziegler-Nichols é heurístico, mas pode levar a resultados satisfatórios com 
ensaios simples. Controladores baseados em conhecimentos, em geral, 
estão nessa categoria, mas eventualmente são combinados com métodos 
numéricos (por exemplo, para treinamento de redes neurais artificiais 
ou para ajuste das regras e das funções de pertinência dos conjuntos 
nebulosos envolvidos). 


e Métodos automatizados ou analíticos como a autossintonização (self- 
tuning), controle robusto, MRAC, MPC e outros. 


12.11 Simulações e testes 


e Testes são essenciais, principalmente quando foram feitas aproximações 
(linearização, polos congelados, atraso desprezível, sem atrito seco, sem 
quantização, viés (bias) negligenciado, ruído branco gaussiano etc.). 


e Modelo de Projeto x Modelo de Verificação: se o teste for realizado com 
o modelo utilizado no projeto, o resultado será aquele esperado pela 
teoria. Deve-se, portanto, usar um modelo que contemple os aspectos 
que foram desprezados. 


e Hardware in the Loop: o iron bird é um sistema completo e real de parte 
de uma aeronave montado em um hangar para efeito de testes. Um 
sistema de navegação inercial montado em uma mesa de três eixos para 
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testes. Embora seja efetivo, há detalhes como o custo, duração para o 
setup, segurança que podem comprometer a viabilidade. 


e Protótipos e plantas piloto: embora as simulações sejam muito úteis, é 
necessário, em projeto de sistemas críticos, a implementação de protóti- 
pos, ou plantas piloto que possuem total funcionalidade. 


12.12 Documentação 


Essa é uma etapa que deve ocorrer em todas as fases do projeto devido a razões 
variadas. 


e Amnésia técnica: projetos não documentados apresentarão dificuldades 
na atualização, manutenção ou duplicação. 


e Verificação de conformidade: uma documentação precisa, detalhada e 
objetiva permite um acompanhamento eficaz do desenvolvimento do pro- 
duto de modo fiel ao planejado. 


e Implicações legais: em casos de litígio ou processos penais, a documen- 
tação pode comprovar (ou não) a adequação do projeto. 


e Homologação e certificação: alguns equipamentos críticos tais como equi- 
pamentos hospitalares e veículos aéreos requerem a submissão de uma 
documentação extensa do projeto. 


e Controle de custos: a documentação ajuda a controlar os custos, permi- 
tindo avaliações dos efeitos da variação do câmbio, taxas de importação, 
proibição da importação e outros fatores de volatilidade. 


12.13 Implementação 


A implementação depende, obviamente, do sistema específico em desenvolvi- 
mento. 


Porém, algumas ponderações são relevantes. 


e Os testes de aceitação dos equipamentos são cruciais, pois, uma vez 
instalados no campo, poderá ser difícil fazer alterações ou até mesmo 
verificações. 


e À sequência das tarefas envolvidas na implementação pode afetar signi- 
ficativamente a eficácia da implementação. 
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e À partida pode requer procedimentos especiais. Por exemplo, se o con- 
trolador vai operar em torno de um certo ponto de operação, mecanismos 
específicos devem levar o processo às condições iniciais adequadas. 


e Atentar para a “curva da banheira” que representa a probabilidade de 
falhas x tempo. Em particular, os produtos novos estão sujeitos a maior 
probabilidade de erros de projeto e de implementação (nos antigos, as 
falhas são mais relacionadas a desgaste e envelhecimento). 


12.14 Entrega 


A entrega é uma ocasião especial que, por vezes, demanda uma atenção espe- 
cial e pode requerer alguns rituais específicos. 


e Em alguns setores, é mandatória a certificação realizada por instituições 
especiais e independentes. 


e Todas as parte envolvidas devem ter acesso aos resultados de check de 
conformidade e aceitação. 


e Questões de propriedade intelectual, sigilo industrial e patentes podem 
limitar a entrega de documentação. 


e À elaboração de planos de contingência é recomendada para acomodar 
casos de eventos não antecipados (por exemplo, contar com sobressalen- 
tes, instrumentos de medidas, equipamentos de proteção etc.). 


12.15 Sintonizacao fina e otimização 


e Diferentemente de simulações, o processo real fornece dados concretos da 
operação do controlador e a coleta de dados de operação pode propiciar 
oportunidades para a melhoria do desempenho do controlador. 


e Em alguns casos há um sistema supervisório ou de data logging que 
permite um monitoramento detalhado da operação do processo, podendo 
contribuir para a manutenção baseada em condição, correções periódicas 
dos pontos de operação, melhoria da eficiência e manejo dos insumos etc. 


e O resultado de um problema de otimização depende da função de desem- 
penho (em geral, maximização do retorno ou minimização das perdas). 
Porém, normalmente existem objetivos conflitantes e, por exemplo, au- 
mentar a taxa de produção de uma máquina pode levar a produtos de 
qualidade inferior. 
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e Em princípio, uma sintonia fina poderia ser automatizada, mas o custo 
pode ser a complexidade e talvez o comprometimento da dependabilidade 
do sistema. (segundo a Wikipédia: “O termo dependabilidade é uma 
tradução literal do termo inglês dependability, que indica a qualidade 
do serviço fornecido por um dado sistema e a confiança depositada no 
serviço fornecido”. 


12.16 Operação assistida 


e Sistemas complexos podem exigir um treinamento específico dos seus 
operadores, não somente para os procedimentos de rotina, mas também 
para emergências. 


e Em vista da “curva da banheira” já mencionada e de eventos não ante- 
vistos, é conveniente que a operação seja assistida, no início da operação, 
para a eventual necessidade de mitigar os problemas encontrados. 


e Mais uma vez, lembrar que a operação assistida envolve custos de pes- 
soal e de material, principalmente se forem feitos experimentos com o 
processo (por exemplo, aplicar um degrau ou injetar ruídos). 


e À operação assistida é uma oportunidade para obter novos conhecimen- 


tos para aproveitamento em projetos futuros. 


12.17 Manutenção 


e E importante lembrar que tanto garantias quanto contratos de manu- 
tenção costumam incorrer em elevação de custos. 


e São aplicáveis a manutenção corretiva, a programada e a baseada em 
condições. 


e Na modalidade de manutenção corretiva, a ação só ocorre após a insta- 
lação da falha. 


e Na manutenção programada são feitas ações periódicas compatíveis com 
expectativa de falhas. 


e Na manutenção baseada em condição, mecanismos especiais monitoram 
a degradação e são realizadas ações quando um nível de aceitabilidade é 
ultrapassado. 
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12.18 Desativação 


Embora essa etapa não seja sempre relevante, por vezes a desativação pode 
requerer procedimentos especiais, por exemplo, no caso de envolver materi- 
ais radioativos, componentes contaminados por patógenos (bactérias, fungos), 
substâncias tóxicas etc. 


e Analogamente à partida, a desativação de um controlador pode exigir 
mecanismos especiais, contrastando com paradas abruptas, por exemplo, 
em decorrência de falhas. 


e Se a desativação for permanente, deve-se contemplar procedimentos para 
descarte, por exemplo, material radioativo (por exemplo, sensor de gra- 
matura de papéis usando raios beta oriundos de Kr85 ou Sr90) ou equipa- 
mentos utilizando SF¢%, que é um dos gases envolvidos no efeito estufa). 


e À desativação de um sistema mais antigo pode ocorrer devido à atualiza- 
ção tecnológica, por exemplo, substituição de um equipamento analógico 
para digital. 


12.19 Mitigacao do efeito de falhas 


Infelizmente, não existem sistemas totalmente livre de falhas. 


Logo, muitas vezes é necessário incorporar aos sistemas de controle mecanis- 
mos para mitigar os efeitos de possíveis falhas, principalmente em sistemas 
críticos tais como os equipamentos médicos, veículos de transporte (aviões, 
trens, navios), processos químicos que manipular substâncias letais, equipa- 
mentos que utilizam radioisótopos etc. 


De modo simplificado, a mitigação pode ser classificada como ações anteriores 
ou posteriores a uma falha. 


Com o intuito de organizar a apresentação, o termo falha é utilizado para de- 
signar ocorrências tipo “parada de funcionamento” ou “quebra de uma peça”. 


Por outro lado, a causa de mau funcionamento de equipamentos em função 
do envelhecimento do componente (por exemplo, relacionado com a migração 
de íons em semicondutores, precipitação de cristais em baterias etc. ) ou des- 
gaste devido à utilização (pneus “carecas”, engrenagens com folga etc.) será 
denominado de degradação. 


As categorias básicas de métodos relacionados com falhas são aquelas baseadas 
em séries temporais (sinais ao longo do tempo) e as baseadas em modelos. 
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12.19.1 Ações pré-falhas 
As ações anteriores à falha se referem àqueles realizadas no sentido de: 


1. Reduzir os efeitos de mau funcionamento devido a uma degradação pro- 
gressiva (devida ao desgaste ou o envelhecimento) até culminar em de- 
sempenho inaceitável (p. ex., devido a entupimento de duto, oxidação 
de uma peça). São exemplos: entupimento de dutos e orifícios, oxidação 
de uma peça, acúmulo de resíduos etc. 


2. Reduzir a probabilidade de ocorrência de uma falha abrupta. São exem- 
plos: curtos ou abertos em circuitos elétricos, rompimento de uma tubu- 
lação, travamento de um eixo etc. 


3. Prolongar a vida útil de componentes degradados. São exemplos: au- 
mentar a potência do cooler, ativar uma bomba auxiliar, reduzir o esforço 
a ser demandado pelo transdutor, relaxar especificações operacionais de 
desempenho etc. 


Várias ações podem reduzir o processo de degradação, tais como a adequada 
filtragem de fluidos, boa regulação da tensão de alimentação, frequente lim- 
peza de dissipadores de calor, verificação e aplicação periódica de lubrificantes 
etc. 


A utilização de componentes de melhor qualidade (com melhor MTBF - mean 
time between failure) e sua correta utilização (conforme as recomendações do 
fabricante) também tendem a reduzir o risco de ocorrência de falhas. 


A partir do conhecimento do MTBF, pode-se, por exemplo, planejar uma ma- 
nutenção preventiva, como o que ocorre com os automóveis, tais como troca 
da correia dentada com 50.000 km, troca dos lubrificante a cada 10.000 km 
etc... 


Um detalhe interessante é que a taxa de falhas tende a ocorrer no início da vida 
do componente (por exemplo, devido a falhas na montagem, embalagem ou 
transporte, além de instalação incorreta) ou mais tardiamente, agora devido 
ao desgaste com o uso ou envelhecimento ao longo do tempo (na literatura da 
teoria de confiabilidade, o gráfico de taxas de falha com o tempo é referido 
como a curva da banheira). Em havendo a disponibilidade de sensores e atu- 
adores incorporados no sistema, podem ser realizados testes específicos para 
aferir o adequado funcionamento dos componentes (built in tests). 


O prolongamento da vida útil de um componente, ou seja, manter a sua ope- 
ração com adequada confiabilidade, porém com desempenho reduzido a um 
nível aceitável, requer a monitoração do estado através de sensores adequados 
(por exemplo, mediante a medida da intensidade e faixa de frequência das 
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Incidência 
de Falhas 


Curva da “Banheira” 


Falhas Falhas devidas 
precoces ao envelhecimento 


Figura 12.1: Curva da banheira: incidência de falhas ao longo da vida útil de 
um componente. 


vibrações ou do ruído audível, análise das características dos eletrólitos das 
baterias, detecção da presença de limalhas no fluido de lubrificação etc.). 


A figura 12.2 apresenta, graficamente, o conceito de RUL (textitremaining use- 
ful life), utilizável tanto no enfoque de prolongamento da vida útil de compo- 
nentes, bem como para manutenção baseada em condição. Ter uma estimativa 


de “falha” 


A 
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Figura 12.2: Estimação do remaining useful life. 


do instante de ocorrência de uma falha com um adequado nível de significância 
é útil para a segurança da operação, bem como do ponto de vista econômico, 
no sentido de se evitar o descarte de um componente ainda hígido e também 
para planejar o estoque de peças de reposição. 
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12.19.2 Ações pós-falhas 


Quando ocorre uma falha, faz-se necessária uma manutenção corretiva ou al- 
gum mecanismo de tolerância, tais como a ativação de equipamentos redun- 
dantes ou de reserva. Em alguns casos é invocada a intervenção do operador 
humano. 

Em linhas gerais a ocorrência de falhas leva aos processos de detecção, isolação 


e recuperação, podendo envolver diagnóstico e mitigação propriamente dita da 
falha (fault detection, isolation, and recovery - FDIR). 


Detecção de falhas 


Para se garantir a segurança ou a continuidade das operações, pode-se valer 
também de mecanismos de tolerância a falhas, tipicamente baseadas na exis- 
tência de algum tipo de redundância. 


A detecção de falha pode ser realizada com base em diferentes enfoques, como 
ilustrado com alguns exemplos. 


e Verificação da consistência entre três sensores que monitoram a mesma 
grandeza e fazer uma votação 2 em 3. 


e Verificação da consistência entre sensores de tipos diferentes, mas que 
se relacionam segundo um modelo analítico (por exemplo, entre a vazão 
medida por sensor Doppler e a queda de pressão do fluido que atravessa 
um orifício). 


e Verificação da consistência entre o modelo identificado (com os parâme- 
tros estimados) e o modelo nominal (com os parâmetros nominais). 


e Verificação da paridade dos dados transmitidos. 


e Utilização de cão de guarda (watch dog timer.) 


Isolação da falha 


Detectando-se uma falha, aciona-se em geral um alarme e um sinal que inicia 
alguma forma de mitigação. 


É importante notar que um mau funcionamento de algum componente pode 
eventualmente disparar vários alarmes distintos relacionados com processos 
ligados a essa falha e que podem confundir o operador, ou então o mesmo 
alarme ser acionado repetidas vezes se não houver um mecanismo de deboun- 
cing. 


O passo subsequente é a isolação da falha, ou seja, o reconhecimento de qual 
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a ocorrência que originou os sintomas da falha (qual sensor, qual subsistema, 
qual processador etc.). 


Dependendo da ocorrência, são tomadas ações que podem variar de comutação 
para o modo normal, parada emergencial, operação degradada ou acionamento 
de mecanismos de tolerância a falhas. 


Ativação do back up 


Um controlador back up pode ser do tipo sempre ativo ou estar em stand by e 
ser ligado quando necessário. 


Assumindo que se tem componentes idênticos, independentes (pois se, por 

exemplo, os dois são alimentados pela mesma rede elétrica, a falha de um 

pode estar relacionada à do outro) e com a densidade de probabilidade de 

falha dado por p(t) = \e~*“, tem-se que o instante esperado (médio) de falha 
1 3 


é Et] = x para conexão em série, E[t] = $ para conexão paralelo e E[t] = 4 
1 


para conexão stand by (uma unidade simples teria Eft] = x). 
Convém mencionar que, embora a conexão stand by tenha o melhor MTBF, 
há a necessidade de “ativar” a unidade back up, que pode estar ligada mas 
inativa ou mesmo desligada. 


Controladores tolerantes a falhas 


Para se garantir a segurança ou a continuidade das operações, pode-se valer 
também de mecanismos de tolerância a falhas, tipicamente baseadas na exis- 
tência de algum tipo de redundância e adequadas leis de adaptação, tanto 
paramétrica quanto estrutural. 


12.20 Condições operacionais de sistemas de controle 


Mesmo que o projeto tenha sido realizado obedecendo as boas práticas e que 
não tenham ocorrido degradações ou falhas de componentes, a tentativa (ou a 
necessidade) de operar o sistema em condições além dos limites estabelecidos 
pode resultar em situações inconvenientes. Assim, é interessante que se esta- 


beleçam regiões (envelopes) de operação para que o sistema de controle possa 
exibir um desempenho adequado. 


Por exemplo, as regiões de operação poderiam ser classificadas em: 


1. Operação normal ou rotineira: o sistema exibe alto desempenho em ter- 
mos de eficiência, precisão, reduzido desgaste de componentes etc. 
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2. Operação intensiva: o sistema ainda exibe bom desempenho em termos 
das especificações mais relevantes, mas pode ter a eficiência reduzida, 
apresentar maior desgaste de componentes, maior dispersão dos erros 
etc. Trata-se, por exemplo, de casos de emergência, atrasos na produção, 
demandas acima do esperado etc. 


3. Operação limite: condição de operação que não deve ser ultrapassada, 
possivelmente porque o projeto não levou em consideração essa situação 
em que podem ocorrer valores excessivos de grandezas como pressão, 
temperatura, tensão, corrente, força etc. e que eventualmente incorra 
em perda da controlabilidade (loss of control). 


Z 


Para que um sistema nao passe a operar em uma condição limite, é inte- 
ressante que se incorporem mecanismos de “proteção de envelope”, ou seja, 
incluir no projeto mecanismos que impeçam o processo de adentrar tal região 
de operação. Ou existir um mecanismo de recuperação, de tal forma que, se 
for ultrapassada a fronteira da região limite, existam formas de voltar a ter a 
controlabilidade. 


Caso se reverta ao modo manual, deve-se ter em mente que o operador humano 
deve estar devidamente treinado para lidar com situações não rotineiras 


No caso de controle de aeronaves, o conceitos estão bem elucidados do docu- 
mento FAA AC-25-7C. 


O projeto de controladores deve seguir as boas praticas recomendadas pela 
Engenharia de Sistemas, uma vez que a obtencao das leis de controle é 
apenas uma parte do problema. Vários fatores, como a segurança, o custo, a 
disponibilidade, a sustentabilidade e muitos outros, devem ser considerados 
em aplicações críticas e sofisticadas, como o caso de veículos de passageiros, 
equipamentos médicos, centrais nucleares, armamentos etc. 


12.21 Comentários 


As etapas para o desenvolvimento de Sistemas de Controle que são menciona- 
das neste texto são inspiradas na literatura de Engenharia de Sistemas. 


Uma boa fonte de informações sobre Engenharia de Sistemas é o texto aberto 
da NASA: National Aeronautics and Space Administration - NASA - Sys- 
tems Engineering Handbook, NASA SP-2016-6105, Rev2, NASA Headquar- 
ters, Washington, 2016. 


A primeira utilização da palavra reliability é atribuída ao poeta Samuel T. 
Coleridge, 1816. Vide Saleh, J. H. e Marais, K. Highlights from the early (and 
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pre-) history of reliability engineering. Reliability Engineering and System Sa- 
fety, Elsevier, v. 91, n. 2, p. 249-256, 2006. 


A origem do conceito de FMEA é atribuído ao documento MIL-P-1629, Pro- 
cedures for Performing a Failute Mode, Effects and Criticality Analysis de 9 
de novembro de 1949, patrocinada pelas Forças Armadas dos Estados Unidos. 


O surgimento da disciplina Reliability Engineering ocorreu por volta de 1950, 
quando a Força Aérea dos Estados Unidos apurou que o custo de reparar e 
substituir equipamentos eletrônicos da época era cerca de dez vezes o seu custo 
original. 


Constituiu-se, então, o Advisory Group on the Reliability of Electronic Equip- 
ment (AGREE) pelo Departamento de Defesa dos Estados Unidos, operando 
entre 1956 e 1958. 


12.22 Exercícios 


12.22.1 Exercício: Especificações de requisitos 


Conceber potenciais requisitos para o problema de controle envolvidos em 
seguintes atividades 


1. Iluminação hospitalar 
2. Tratamento de efluentes (esgoto) 
3. Construção de drones 


4. Fabricação de brinquedos 


12.22.2 Prognóstico de falhas 

Que vantagens econômicas e sociais poderiam advir de um sistema que permita 
prognosticar falhas em equipamentos de engenharia? 

12.22.3 Falhas, faltas, mau funcionamento, defeito e erro 

Verificar o significado das palavras listadas no título da questão, tanto em 
termos da língua portuguesa, quanto da inglesa. 

12.22.4 Exercício: Controle tolerante a falhas 


Dissertar sobre como seria um controle tolerante a falhas para o sistema de 
controle de profundidade de um submarino. 
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12.22.5 Exercício: Manutenção 
Comentar sobre: 

1. Manutenção corretiva 

2. Manutenção programada 


3. Manutenção preditiva 


4. Manutenção baseada em condição 


12.22.6 Exercício: Qualidade 


1. O que se entende por um sistema de controle de alta “qualidade”? 


2. O que se entende por um sistema de controle de baixa “qualidade”? 


12.22.7 Exercício: Produtividade 


Como se expressaria o conceito de produtividade em termos das especificações 
de desempenho de um controlador automático? 


12.22.8 Exercício: Dependabilidade 


Um termo que tem recebido muita atenção é dependabilidade. Buscar o signifi- 
cado desse conceito na Internet e comentar sobre a possibilidade de incorporá- 
lo como parte dos requisitos de um sistema de controle. 


12.22.9 Exercício: Inovação 


Um termo que tem recebido muita atenção é inovação. Há diferença de sig- 
nificado entre as palavras inovação e invenção? Cite exemplos de inovação e 
inovação na área de sensores e transdutores. 


12.22.10 TRIZ 


A sigla TRIZ, originada do russo Teoriya Resheniya Izobretatelskikh Zadatch, 
pode ser traduzido como Teoria da Resolução Inventiva de Problemas. Buscar 
elementos dessa teoria na Internet e comentar sobre o potencial de uso dessa 
teoria no desenvolvimento de projeto de sistemas de controle. 


Parte VI 


Apêndices 


453 


13 
Apêndices 


“We think in generalities, but we live in detail.” 
— Alfred North Whitehead 


13.1 Apêndice A - Equação de Euler-Lagrange 


Um dos métodos apresentados no capítulo sobre modelagem de sistemas de 
tempo contínuo utiliza a equação de Euler-Lagrange. 

A equação de Euler-Lagrange surge como uma condição de extremalidade no 
cálculo de variações, quando se busca minimizar a função de ação (princípio 
de Hamilton, (GOLDSTEIN, 1980)). 

Aqui é apresentado um caso particular conhecido como o problema mais sim- 
ples do cálculo de variações, que consiste em determinar uma função x*(t) tal 
que 


J|x*] = min J[x] (13.1) 

sujeito às restrições 
x(to) = Xo (13.2) 
x(ty) = Xf (13.3) 


Usualmente são adotados para X conjuntos tais como C! ( [to t ‘| Re), ou 
seja, espaço de funções diferenciáveis com a primeira derivada contínua. 


As grandezas to, tf, Xo e xy são assumidas fixas e J : ¥ — R é da forma, 


Jix] = f “Cesto do (13.4) 


0 
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Assuma que existe x*(t) é uma solução local (ponto de mínimo de J). 


Então, se x*(t) for perturbado por uma função h, o custo J deve aumentar, 


dis") < J[x* + h] (13.5) 
Seja h uma função Ct (ftot Re), tal que h(to) = 0. 


x(a 


h(t) 


= 


Figura 13.1: A linha vermelha representa o efeito da adição de eh(t) (traçado 
em azul), à curva ótima x*(t) (em verde). 


Seja, ainda, h = ch (vide figura 13.1), em que £ € Re J : R > R, segundo 
J(e) = J[x* +h] (13.6) 
J[x* + £h] (13.7) 


Como x*(t) é assumida ser ótima, J(e) deve ter um ponto estacionário para 
e=0,ou 


=0 (13.8) 


e=0 


Explicitando os termos no integrando, obtém-se 


Je) = / e (t, x* (£) + eh (1), (t) + eh (t)) dt (13.9) 


to 
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e, portanto, 
ae _ [ex (o x) helt toh dt (13.10) 
= [cx (8) (0) hat + 
+ S" cxlt,x(t), 0) he) at (13.11) 
to SOON 


u dv 
Utiliza-se agora o método de integração por partes 


tf 
i u dv = uv 


to 


tr tf 
— | v du (13.12) 
to 


to 


Lembrando que h(to) = O e h(t) = O e também omitindo-se os argumentos 
de cx e cx para simplificar a notação, chega-se a 


dv = hd > v=h (13.13) 
ty tf 
uv = teh) =0 (13.14) 
to to 
e, logo, 
tf tf 
/ udv = 0- v du (13.15) 
to to 
tf d 
= — h —cx dt 13.16 
to dt ( ) 
A expressão we) pode agora ser escrita na forma 
T ty tr 
di(e) _ / cxhdt + | ` udv (13.17) 
de to to 
bf d 
= i |. — Sa hdt (13.18) 
to dt 


em que os argumentos de cx, cx e de h foram omitidos para simplificar a 
notação. 


Como a perturbação h é escolhida arbitrariamente, deve-se ter 


di 
dE 


Essa equação é conhecida como a de Euler-Lagrange. 


=0 (13.19) 


x=x* 
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Exemplo 


Seja o problema de cálculo de variações em que z : R >R e z e C! 


iS I * E) —2(0)] at (13.20) 
com as restrições 
x(0) = 0 (13.21) 
x (5) =a) (13.22) 
Fazendo-se a associacao 
c(t, x(t), &(t)) = t° (t) — 2? (t) (13.23) 
e os termos requeridos na equação de Euler-Lagrange são: 


Cy = —2r (13.24) 
ch = 2% (13.25) 


Substituindo-se esses termos na equacao de Euler-Lagrange, tem-se que 


d o. 
(3 (24) + 2) 


Logo, a condição necessária a ser satisfeita por x = x* é 


=0 (13.26) 


t+2=0 (13.27) 


cuja solução é 
x*(t) = a + bsin(t) (13.28) 


Impondo as condições de contorno, 


a+bsin(0) = 0 (13.29) 
a+ bsin(5) = i (13.30) 

obtém-se 
a=0 ; b=1 (13.31) 


e a solução do problema é 
x* = sin(t) (13.32) 
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13.2 Apêndice B - Iteração de Picard 


Apresenta-se aqui um caso particular da iteração de Picard, aplicada a sistemas 
LTI (x = Ax + Bu) para obtenção a fórmula explícita para x(t) a partir de 
x(0) dado. 


Considere inicialmente a equação sem a excitação u, 
x= Ax ; x(0) = xo (13.33) 
e, lembrando que x = de, pode-se escrever 


dx 


Ax(t)dt (13.34) 
x@) = x94 [axmar (13.35) 


A dificuldade para resolver 13.35 está no fato de que x está presente em ambos 
os lados da equação. 


No método iterativo (iteração de Picard), a ideia é construir uma sequência 
de funções usando a recursão 


klo = xo ;Vt>0 (13.36) 


t 
Xo +f A [x(t)];_; dr ;i=1,2,3,... (13.37) 
0 


— 
Kai 
e. 
— 
HK 
YN 
I 


em que [x], denota o i-ésimo termo da sequéncia. 


Aplicando-se a recursão proposta, tem-se 

[k] (t) = xo (13.38) 
t 

x], () = xt f Akus (14 Ad) x (13.39) 
0 
t 

ix], (t) = xo + | A (I+ At) xo dr 
0 


= (1 + At+ SA?) xo (13.40) 


t 
[x]; (t) = x+ f A (isatt arig) xo dr 
0 


(k- 1)! 


1 1 
(1 +At+ sat ++ Ate Ja (13.41) 


Ax (t) 
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Pode-se verificar que os termos 
1 1 
A,(t)=1+ At+ sat ++ gate (13.42) 


constituem uma sequência de Cauchy que converge ( || Am(t) — An(t) || > 0 
se m,n — 00) e convenciona-se denotar o limite por e^t 


e^t =I+At+ TU + Ar + (13.43) 
Para a solução do caso em que há uma excitação u, 
x= Ax + Bu ;x(0) = xo (13.44) 
faça-se a mudança de variáveis 
z(t) = e “*'x(t) (13.45) 


Diferenciando-se essa expressao e usando a regra da cadeia 


dz -At dx 


2S —A —At . 
Ai e *'x(t) +e dt (t) (13.46) 
= —Ae“*'x(t) + e~“! [Ax(t) + Bu(t)] = e"“*Bu(t) (13.47) 
já que A e e 2! comutam. 
Reescrevendo-se essa equação, tem-se 
dz = e “*Bu(t) dt (13.48) 
t 
z(t)—2(0) = / A" Bu(r) dr (13.49) 


0 
t 
ey = Bort l “A Bu(r) dr (13.50) 
0 
Substituindo-se z(t) = e Atx(t) e z(0) = x(0), obtém-se que 
t 
e Aix(t) = x(0) +f ec“ Bu(7) dr (13.51) 
0 


A matriz e~4* é não singular (vide a fórmula de Jacobi, por exemplo, em 


(BELLMAN, 1974)). 
det (et) = eA) 20 (13.52) 


-1 
Portanto, fazendo-se (em) = e^t obtém-se a expressão desejada 


t 
e^tx(0) + e™ | e A™Bu(r) dr (13.53) 
0 


t 
e^tx(0) + f eA Bu(r) dr (13.54) 
0 


x(t) 
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Observações 


1. Muitas vezes é utilizada a notação ®(t1, to) para representar e4(t1~*0), 


Na literatura, P(ti,to) é denominada matriz de transição de estados, 
já que para sistemas x = Ax a solução a partir de x(to) é x(ti) = 
eAli—to)x (tg) = (tı, to)x(to). 


2. No caso de uma matriz A(t) comutar com K A(r) dr, pode-se mostrar 
pelo mesmo método (construindo a sequência {[x];};=0,1,2,..., conhecida 
como de Peano-Baker) que a solução do caso não autônomo 


x= A(t)x ;x(0) = xo (13.55) 


é dada por 
x(t) = elo Mo)do (13.56) 
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13.3 Apêndice C - Exponencial de matriz 


Dado o sinal de entrada u(t), a solução de x = Ax+ Bu a partir de x(0) = xo 
é dada por 


t 
x(t) = e™xo +f Bu (7) dr (13.57) 
0 
em que 


1 1 
e^t 14 At+ she + gat +... (13.58) 


E interessante, portanto, dispor de métodos para obtenção da expressão ex- 
plícita para e^. 

Existem vários métodos conhecidos e neste apêndice são apresentados dois dos 
mais populares 


1. utilizando a diagonalização 
2. utilizando o teorema de Cayley-Hamilton 
Outros métodos podem ser encontrados em 


1. Moler, C. e Van Loan, C. Nineteen dubious ways to compute the expo- 
nential of a matrix. SIAM Review, v. 20, n. 4, p. 801-836, 1978. 


2. Moler, C. e Van Loan, C. Nineteen dubious ways to compute the expo- 
nential of a matrix, twenty-five years later. STAM Review, v. 45, n. 1, 
pp. 3-49, 2003. 
13.3.1 Diagonalização - Caso com autovalores distintos 
No caso especial de matrizes diagonais, 


; | 


A2 
AS (13.59) 


é imediato verificar que 


e^ = (13.60) 
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Portanto, se a matriz Anxn é tal que os seus n autovalores A; são distintos, 
então, pode-se valer da diagonalização, notando que 


AM 


Al vi Vo ce va [=| Vo ce Vn ag : (13.61) 


em que v; são os autovetores associados a A;. 


Pode-se mostrar que P é não singular (vide, por exemplo, (CHEN, 1970) e 
(STRANG, 1988)) e, de fato, constitui uma transformação similar 


A = PAP”! (13.62) 
Logo, é imediato no caso de autovalores distintos que 
e^t pop (13.63) 
já que 
A” = PAP! x PAP! x...x PAP! (n vezes) (13.64) 
PAP! (13.65) 


13.3.2 Teorema de Cayley-Hamilton 


Um método mais geral pode ser obtido com o auxílio do teorema de Cayley- 
Hamilton. 


Seja o polinômio característico de A 


A(s) = det(sI- A) (13.66) 
= ags” + as" fags” pride sad (13.67) 


e defina o polinômio de matriz 
AMA) = ap A” + aj A"! Las +--+ + an_1A + al (13.68) 


que possui os mesmos coeficientes que A(s). 
Notar, porém, que A: C > C, enquanto A: RPM > Rn, 


Segundo o teorema de Cayley-Hamilton, 


A(A) =0 (13.69) 
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De fato, pela fórmula de inversão de matrizes, 


(sI— A)! adj (sI — A) (13.70) 


1 
-~ det (sI — A) 
em que adj (sI — A) é a matriz adjunta (ou a dos cofatores transposta). 


Reescrevendo-se essa expressão, tem-se que 
Idet (sI — A) = (sI — A) adj (sI — A) (13.71) 
em que se sabe que adj (sI — A) é um polinômio de matriz de grau n — 1 
adj (sI — A) = Ros"! + Ris? +... + Ry_os + Ra (13.72) 
Lembrando que 


det(sI — A) = aos” + ays"! + azs"? + --- + an_1s + an (13.73) 


obtém-se a seguinte identidade de polinômios 


agIs” + aie + + anl — (sI = A) [Ros ++ Ra-28 + Rn] 
D eee” 
w aM 
LE LD 
(13.74) 


Colocando-se o lado direito LD em ordem decrescente de potências de s resulta 
que 


LD = Ros" +R 1 +---+Rp_287 + Ra-1s (13.75) 
-ARos” |! — ARs"? —...— ARn—25 — ARn_1 (13.76) 


Igualando-se os coeficientes de LE e do LD de mesma potência em s, obtém-se 
que 


aol = Ro (13.77) 
al = R, = ARo (13.78) 
azl = Rə e AR, (13.79) 
An—11 = Ra-1 = AR, _2 (13.80) 


anl = —ARp_1 (13.81) 
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Ro = agl (13.82) 
R; = al+ ARS (13.83) 
Ro = asl+ ARS (13.84) 
Rn-1 = Gn—-11+ AR, (13.85) 
anl = —ARy-1 (13.86) 


Esse sistema pode ser resolvido por substituigdes sequenciais. 


Fazendo-se as substituições a partir de Ro, tem-se que 


Ro = aol (13.87) 

Ri = al+aA (13.88) 

Ro = agl+aqyA+ aj A? (13.89) 

Rn-1 = Gn—-11+an-2A+...+ ag A”! (13.90) 

e substituindo-se R,_; na última equação anI = — AR, obtém-se o resultado 


desejado, 
A(A) = qA” +a, A"! tas +--+ + an1A + a,I = 0 (13.91) 


Por abuso de notação, denota-se muitas vezes A(A) = A(A) e diz-se que “uma 
matriz quadrada anula o seu polinômio característico”. 


Representação de polinômios de matrizes 

Dada uma matriz Ay xn, seja A(A) o polinômio cujos coeficientes são as mes- 
mas que a de A(s). 

Considere, agora, um polinômio genérico P(A) de grau qualquer. 

O polinômio P(A) pode ser colocado na forma (Q e R são respectivamente o 


quociente e o resto) 
P(A) = Q(A)A(A) + R(A) (13.92) 


apenas ajustando os respectivos coeficientes das poténcias de A nos lados 
esquerdo e direito da identidade. 


Pelo teorema de Cayley-Hamilton, A(A) = 0 e conclui-se que 


P(A) = R(A) (13.93) 
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ou seja, qualquer polinômio de matriz pode ser expresso como uma combinação 
de potências até grau n — 1 


P(A) = aol +a A 4+ a2A?+...+an-1A" (13.94) 


sendo que os coeficientes a; ainda devem ser determinados. 


Como a expressão satisfeita por P(A) é a mesma que aquela satisfeita por 
cada autovalor A;, deve-se ter também que: 


P(A) = agtayA,+ ao? uso Gi (13.95) 
P()2) = ao+ajÃo + aA? aig Se pas > (13.96) 
PO) = Go+Q1rAn toad, +.-.+On—1An (13.97) 


com A; sendo as raizes de det(sI — A) = 0 (assumidas distintas). 


At 


No caso especial de P(A) = e2*, resolve-se o sistema de equações 


eM = ao(t)+ar(t)Ar +as(tA +... +an-i(t)A (13.98) 
eò2t = aolt) + ai (t)à2 + a(t) 3 Eorna aise (13.99) 


ent = alt) + ar(t)An + a(t)? +... + an_1(t)A®-! (13.100) 


e obtém-se (a1(t), v2(t),--- ,an(t)). 
Portanto, a fórmula fechada desejada para e^t é dada por 
eAt = ao(t)I + (DA + a9(t)A2+...+an_1(t)A”™! (13.101) 
Exemplo 
Dada a matriz 
0 1 
A= | E: | (13.102) 


deseja-se obter uma expressão fechada para e^t. 


Para utilizar o método baseado no teorema de Cayley-Hamilton, seja 


1 
Mt = co | 2 + Oy 


0 1 —6 —5 


ae: | (13.103) 


Os autovalores de A são obtidos de 


10 0 1 
aff dek al = 0 (13.104) 
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cujas raízes são s = —2 es = —8, ou seja, os autovalores são Aj = —2 e 
Ag = —3. 
O sistema de equações que fornece os coeficientes a; são 
et = agta > e7” = ao — a (13.105) 
et = ao + ayÃo > et = ag — 301 (13.106) 
cuja solucao é 
ao = Bert — 2e’ (13.107) 
ay = e” oe" (13.108) 
e, portanto, 
1 0 0 1 
At _ -2t 9-3 -2t 3 
eAt = (3e7% — 2¢ | | | +(e” -e IE Ra fiso) 
3 1 —2 -1 
A Agt -3t 
e E AE | l (13.110) 


Como esse exemplo pode ser resolvido também via diagonalização, pois A £ 
A2., busca-se a matriz de transformação P. 


Os autovetores são 
0 1 ULI 
—6 —5 v1,2 
0 1 v21 
—6 —5 U22 
e, escolhendo-se v1, = 1 e v21 = 1, tem-se vı e v2 associados aos autovalores 


=9 —3 É 


A transformação diagonalizante é 


-2 | Pa | > v12=—2v1, (13111) 
v1,2 


, 


-3 | a | > v22 = —3v21 (13.112) 
U22 


P=| : | (13.114) 


cuja inversa é 


pl = | e | (13.115) 
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e, de fato, 
A = E iil tae IE Pi (13.116) 
—2 0 
a | 0 -3 | (13.117) 
Tendo-se obtido P e P~!, a expressão desejada desejada para e^ é 
ao (13.118) 
1 1 e? 0 3 1 
= | 26. 3k | 0 e-3t DD 1] | (13.119) 
3e72! — 2e—3t et _ et 
7 | —6eT* + 6e% —2e7% + Ie” (13.120) 
3 1 -2 -1 
e —3t 
E 13.121 
E | —6 —2 e | 6 3 | (13.121) 


que é o mesmo resultado obtido anteriormente. 


Uma conclusão relevante é que a resposta de um sistema linear x = Ax a 
partir de xo é uma combinação de exponenciais de Apt (às vezes chamados de 
modos) 


x = ex (13.122) 


n 
(È mies’ xo (13.123) 
k=1 


Caso haja autovalores com multiplicidade maior que 1, utilizam-se as expres- 
sões obtidas derivando-se em A. 


Por exemplo, se À possui multiplicidade 3, são construídas as expressões 
et = AtA? + op? H... H a (13.124) 


te^ ai + 2agr + 303A? +... + (n— Don NT? (13.125) 
Pe = 2a + bagă? +... +(n-— 2(n — Dan AS (13.126) 
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13.4 Apêndice D - Estabilidade de sistemas LTI 


A origem de um sistema LTI (x = 0) é estável se todos os seus autovalores 
(ou as raízes do polinômio característico A(s) ou os polos da função de trans- 
ferência) estão no interior do semiplano esquerdo (SPE). 


Um polinômio que possui todas as raízes no interior do SPE é dito ser de 
Hurtiwz. 


Necessita-se, portanto, de métodos para verificar se um dado polinômio é 
Hurwitz, sem a necessidade de determinar as suas raízes, em vista dos fatos: 


1. não há expressão explícita, em geral, para raízes de polinômios de grau 
maior que 4 (consequência de trabalhos de Galois); 


2. muitas vezes os coeficientes dos polinômios envolvem parâmetros literais. 


13.4.1 Critério de Mikhailov-Leonhard-Cremer 


O polinômio com coeficientes reais A(s) de grau n é Hurwitz se e somente se 
£A(jw) varia de n5 quando w varia de 0 a oo. 


Im[G(s] Im[G(s)] 


Re[G(s)] 


Figura 13.2: Ilustração de como varia a fase de A(jw) à medida que w varia 
de 0 > oo. 


Pela figura 13.2, é imediato notar que a fase de A(jw) varia de 0 a nm/2 à 
medida que w varia de 0 — ov, se todas as raízes estiverem no interior do SPE. 


Em outras palavras, o gráfico de A(jw) percorre n quadrantes à medida que 
w varia de 0 + oo, começando com A(j0) € R* (segmento positivo do eixo de 
abscissas). 
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13.4.2 Critério de Hermite-Bieler 


Sejam E(.) e O(.) polinômios tais que representam as partes par e ímpar de 
A(s), respectivamente, ou, mais especificamente, 


A(s) = aos” Las"! tas"? + ags”? +--+ @n_18 + an (13.127) 
E O E O O E 
= aos” aa fred as Las E +--+ anis 
E E E O O O 
(13.128) 
= a (s*)? +a (52) + +++ + an+ 
—_———j|_ 
E(s?) 
2427? 9201 
+a, (s ) + ags (s ) +---+an- 
ma TD 
sO(s2) 
— E(s*) + sO(s?) (13.129) 


Critério de Hermite-Bieler 


“O polinômio com coeficientes reais A(s) é Hurwitz se e somente se E(r) e 
O(r) possuem raízes reais negativas simples intercaladas”, a > 0 e a primeira 
raíz mais próxima de 0 é de E(r). 

Esse resultado decorre imediatamente do critério de Leonhard-Mikhailov, no- 
tando que E(—w?) é a parte real de A(jw) e vO(—w?) é a parte imaginária. 
Para que a curva A(jw) passe por n quadrantes, deve cruzar os eixos imagi- 
nário e real de modo alternado. 


Logo, as raízes de E(—w?) = 0 e de vO(—w?) = 0 devem estar intercaladas. 


Para w = 0 a fase de A(jw) = 0, e, portanto, o primeiro eixo a ser cruzado 
é o imaginário (Re{A(jwo)} = E(—w@) = 0 para algum wo) e à medida que 
w Î co. 

Polinômios E(r) e O(r) que possuem raízes intercaladas e o eixo imaginário 
é o primeiro a ser cruzado quando w varia de 0 a oo são chamados de pares 
positivos. 


Teorema dos pares positivos 


Sem perda de generalidade, é admitido que n é par, uma vez que, para n 
ímpar, o resultado pode ser obtido com um método análogo. 
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Considere os polinômios com m = n/2 
E(r) = agr” + aor”! +--+ anr + an (13.130) 


O(r) = ar + agr"? +: + an-Ir (13.131) 


Dados E(r) e O(r), constrói-se uma tabela incluindo a linha P(r) conforme 


E : a a G4 ° Gn_-2 Qn 
O : a as as te an-ı 0 (13.132) 
P : b bo ba} ee bn 
em que 
bj = aa bo = RR te bn = An (13.133) 


Será mostrado que E(r) e O(r) formam um par positivo se e somente se O(r) 
e P(r) formam um par positivo. 


Note, inicialmente, que 


P(r) = E(r) — Ei O(r) (13.134) 
pois 
ao o m—1 
E(r)- — O(r) = agr” + agr +---+an-or + an — 
1 
qi (air™ Fag Thon aait) (13.135) 
= (ão — ai) r” + (as — as) prol po + 
a1 aq 
ao 
+ (ano — Dan) r+an (13.136) 
1 
— 0102- 8088 m—1 qo GIRA A005 ni land 
at i ai 
eS ee SS 
by b2 
pe Ega A, t an = P(r) (13.137) 
qa “~ 
N_A bn 
bg a 


Para verificar a suficiência, assume-se que O(r) e P(r) formam um par positivo 
e mostra-se que E(r) e O(r) são pares positivos. 
Em vista de 


P(r) = E(r) — LrO(r) (13.138) 
a 
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Se em um ponto ?, O(f?) = 0, então P(f) 4 0 pois P e Q são pares positivos 
por hipótese. Além disso, se O(f) = 0, P(f) = E(f) e, portanto, E(f) £ 0. 
Se E(?) = 0, então P(?) = —SLr O(?). A alternativa O(?) = 0 resultaria 
P(f) £ 0, o que não é possível. Logo, O(7) 0. 

Portanto, O(?) = 0 ~ E(f) #0 e E(?) =0 ~ O(F) £0. 


A necessidade é verificada com argumento análogo. 


13.4.3 Critério de Routh-Hurwitz 


O critério de Routh-Hurwitz é baseado na aplicação sucessiva do teorema dos 
pares positivos e do critério de Hermite-Bieler. 

Um polinômio de grau n com coeficientes reais A(s) é Hurwitz se não há troca 
de sinais na primeira coluna do arranjo 


S ag a2 aq cer An—4 Gn-2 An 

s : ay a as cc Gn-3 an O 

gies: a bi bo by e. br bn 

s73 Ci C2 Cy ts Cro 

: ; : : (13.139) 
s? Pı P2 P3 

s? q 42 

s! ri T2 

3? ti 


Os rótulos s”,s”~!,..., 81, s° são utilizados frequentemente para identificar as 


linhas da tabela em soluções manuais para organizar os cálculos e pode ser 


dispensada. 


As linhas s” e s"~! são obtidas diretamente de A(s) e as demais linhas do 


arranjo são determinadas usando a mecanização apresentada: 


— a1a2—a0a3 — ajas—agas ua — 414n—4—404n—3 = 
bi = ad bo ES E bros E E bn = An 
a= bıas—abz C2 = bras —abs Cn_] =bn 
1 1 2 2 (13.140) 
ti = an 


e O critério de Routh-Hurwitz consiste, portanto, na aplicação sucessiva 


do teorema sobre pares positivos: (s°,s') par positivo > (s!,s2) par 


positivo; (st, s?) par positivo > (s2,s?) par positivo; ... ;(s"~?,s"—+) 
par positivo = (ane: s”) par positivo, até que se atinja o par requerido 


pelo critério de Hermite-Bieler. 
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e Existem regras adicionais quando o primeiro coeficiente da linha é O ou 
se uma linha inteira é 0. 


13.4.4 Critério de Nyquist 


O critério de Nyquist é muito utilizado por permitir uma visualização gráfica 
direta das propriedades do processo, além de propiciar definições importantes 
como a margem de fase e margem de ganho. 


Os resultados fundamentais para a demonstração do critério de Nyquist são 
o teorema do resíduo e a fórmula de Lucas ((APOSTOL, 1969), (BROWN; 
CHURCHILL, 2013), (KARLIN, 1959), entre outros). 


Teorema do resíduo 


Se f: C — C é uma função analítica em uma região simplesmente conexa 
Q de C, delimitada pela curva fechada T exceto por singularidades isoladas 
o 


ri, «a "q E Q, então 
fi (s) ds = 27j [res (f,71) +--+ +res (f, ra) (13.141) 


o 
em que Q denota o interior de Q, T é percorrida no sentido anti-horário e 
res (f,r;) denota o resíduo de f em r;. 
Teorema de Cauchy 


Se f : C — C é uma função analítica em uma região Q delimitada pela curva 
fechada I, então 


fi (s)ds =0 (13.142) 


Fórmula de Lucas 


Se p(s) = ag(s — 21)(s — 22)...(8 — z4) e p'(s) é a sua derivada, então 


7 1 1 1 
p(s) _ a died (13.143) 
p(s) S— 2] S— 29 5 — Zq 
= q 
= (13.144) 
=i° 


Seja s = z; uma raiz de p(s) de multiplicidade Z > 1 de p(s), ou seja, 


p(s) = (s — zi)“ q (8) (13.145) 
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para algum q (s). Derivando-se a expressão 13.145, obtém-se 
p(s) =£(s— a) a(s) + (s — zi)" q (8) (13.146) 


e, portanto, 
/ £ / 
BAS) +46) (13.147) 
p(s) s-% a(s) 
Procedendo-se analogamente com o polinômio q (s) e assim sucessivamente até 
a última raiz, obtém-se o resultado desejado. 


A fórmula de Lucas pode ser estendida para o caso em que p(s) é uma razão 
de polinômios. 


Considere, inicialmente, um polo s = r; de multiplicidade £ > 1 de p(s), ou 
seja, 


p(s) = (s— ri)" q (s) (13.148) 
para algum q (s). 
Derivando-se a expressão 13.145, obtém-se que 
p(s) = —4 (s — ri) tq (8) + (s — ri) a(s) (13.149) 
e, portanto, 
p(s) td (s) 
p(s) s—ri q(s) 
Combinando-se os resultados para os zeros e para os polos, tem-se para uma 


função f(s) descrita como uma razão de polinômios, com Z zeros e P polos 
em uma regiao 2 que 


(13.150) 


O DR EE a g' (s) 
f(s) = De (13.151) 


o 
em que a função g (s) é analítica em Q. 


Princípio do argumento 


Seja f : C — C uma razão de polinômios, com z;,i = 1,...,Z zeros e rk, k = 
1,...,P polos em uma região Q delimitada pela curva fechada [. Em vista da 
versão estendida da fórmula de Lucas 13.151, 


5 Lg) (13.152) 
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Integrando-se ambos os lados, tem-se que 


Oas d > E ds- $ 2 2) ag (12168) 
r f(s) r |£ s-i T (Si 
em que o último termo é nulo em vista do teorema de Cauchy. 
Pelo teorema do resíduo, 
2a, a É 1 
Ê 5 ds = Š ($ ) ds (13.154) 
r sA a Ee 


1 


2 PA PÓ 
= 27j X res (f, z1) +--- + res ( f, zq) | (13.155) 
i=1 


= 9njZ (13.156) 


e, analogamente, 


o 
f [> = =) ds = 2njP (13.157) 


ou seja, 


Lo o 
Te ds = 273 |Z — P] (13.158) 


A imagem através de f(s) à medida que s percorre uma curva T no plano s é 
uma outra curva A = f (T) no plano {Re{f(s)}, Im{G(s)}}. 
Utilizando a notação w = f(s), obtém-se que 


dw 
FGS TAT 
TO = La ee 
= f du 
Aw 
= Inw|, 
= In|w|e<” 


0 pois A fechado 


j£ 
= In|w||, + Ine’*” 


wOA 
= IAW wor 
= 27jN[0,+0)] (13.159) 
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Combinando-se 13.158 e 13.159, constata-se que o número de voltas de f(A) 
em torno da origem do plano (Relf(s)|,Im[f(s)|t é a diferença entre os números 
de zeros e de polos enlaçados pelo contorno fechado A no plano s. 


N[0,+ 0] =Z-P (13.160) 


A ideia do critério de Nyquist é utilizar este fato para verificar se existem polos 
de malha fechada no semiplano direito (SPD), caso em que o sistema não seria 
estável. 


Imls] Se houver polos 
de Malha Aberta 
sobre o eixo Im. 


deve-se contorná-lo 


Refs] Refs] 
> 


Contorno 
de Nyquist 


Critério de Nyquist 


Seja Ga(s) uma função de transferência de malha aberta com P polos no SPD 
e T o contorno de Nyquist, a ser percorrido no sentido anti-horário. 


A função de transferência de malha fechada é dada por 


Ga (8) 


oo) Ga 


(13.161) 
e, portanto, os polos de malha fechada são as raízes de 1 + Ga (s) = 0. 

O critério consiste em verificar se Z = 0, o número de zeros del+Ga (s) = 0, a 
partir do conhecimento de P (número de polos de malha aberta) e de N [0, ©], 
o número de enlaçamentos do ponto 0 pela curva A = 1 + Ga (T). 

É conveniente, para efeitos de praticidade, substituir N [0,6] por N [-1, ©] e 
traçar A, = Ga (T), que é a versão transladada de 1 + Ga (T) de 1. 

A porção interessante de A; é aquela que corresponde à faixa de Ga(jw) para 


w = 0 aw = œ, ou seja, basta que se trace a versão polar da resposta em 
frequência de Ga(s) (as curvas de Bode já fornecem o módulo e a fase de 


Ga(jw)). 
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A porção de Ga(s) em que |s| é muito grande (semicírculo do contorno de 
Nyquist) corresponde a Ga(s) = 0 no caso de função de transferência estrita- 
mente própria. 


Nessas condições, 


Z= N|-1,+ 0/+P (13.162) 


e, de fato, o sistema será estável se Z = 0, ou seja, nenhum polo de malha 
fechada no semiplano direito (mais rigorosamente, no interior do contorno de 
Nyquist). 

Se o contorno de Nyquist I é percorrido no sentido horário, ou seja, de w = 0 
a w = œ, os enlaçamentos de —1 devem ser considerados positivos se ocorrem 
no sentido horário N [0, + O]. 


Caso a função de transferência de malha aberta possua polos imaginários puros 


ou polo na origem, o contorno deve ser acrescido de desvios infinitesimais, pois 
o contorno IĮ não deve passar por singularidades. 
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13.5 Apêndice E - Equação de Hamilton-Jacobi-Bellman 


O problema LQR pode ser resolvido por um método algébrico como apresen- 
tado, por exemplo, em (OGATA, 1970) ou (GEROMEL; KOROGUI, 2019)). 


Aqui, optou-se por apresentar uma solução utilizando a Programação Dina- 
mica, proposta por (BELLMAN, 1957), baseada no Princípio da Otimalidade, 
com vistas a oferecer uma visão sobre o problema de Controle Otimo. 


Segundo o Princípio da Otimalidade, se um ponto C pertencente a uma traje- 
tória ótima AB a partir de 4, então o segmento CB é também ótima a partir 
de C (notar que se considera apenas o segmento final). 


= B 
O 


O princípio da otimalidade pode ser aplicado ao problema de controle ótimo 
que consiste em encontrar u(t) que minimiza de funcionais da forma 


ty 
Ju] = ey (x(t9)) +f ce (x(7) , u(r), T)dr (13.163) 
to 
sujeito a restrições do modelo da dinâmica do processo 


x = f(x(t),u(t),t) (13.164) 
x(to) = xo (13.165) 


O termo cy é chamado de custo final ou terminal e ce de custo corrente. 


Assume-se aqui que o problema é de instante final fixo, ou seja, ty é conhecido 
e constante. 


Defina V(t,x), a função valor, como sendo 


V(t,x) = min J(t,x)[u] (13.166) 


em que J(t, x)[u] é o custo ainda a ser incorrido (cost to go), estando o estado 
em x(t) = x no instante t 


Ou seja, de modo mais explícito, 


J(t,x)[u] £ E (xt) + i Ce (x(T) ,u(T), T)dr (13.167) 


x(t)=x 
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Se no instante t — At o estado é x”, a utilização de um controle u(.) dado por 


u(t) = | So so tE fists] (13.168) 
u(t) qualquer se t € [t — At, t) 


em que u*(t) denota o controle ótimo, pode-se escrever 


t 


cf (x(ts)) +f Ce (x(7) , u(r), T)dT+ 


—At 


J(t — At,x7)[u] 4 


+ x Ce (x(T) ,u* (T), rd (13.169) 


x(t—-At)=x— 


Rearranjando os termos e utilizando a aproximação de Euler para o pri- 
meiro termo, obtém-se que 


t 
J(t — At,x7)fu] 4 f cenai + (13.170) 
SEE roses 
ccAt 
ts 

Cf (x(t,)) +f ce (x(T) a(r) nar (13.171) 

E x(t—At)=x- 

A partir do modelo da dinâmica, tem-se que 

x(t-At)=x =>x(t)~x + f(x ,u(t),t)At (13.172) 


e o segundo termo da expressão de J(t— At, x )[u] pode ser reescrito como 


E (xlt) + l Ce (x(7) a(o de (13.173) 
x(t—- At)=x— 
~ fer (x(t,)) + ie Ce (x(7) (nner (13.174) 
x(t)=x-+fAt 
= V(t,x + fAt) (13.175) 


já que u (T) = u* (T) se T € [ety]. 
Portanto, a equação para J se torna 


J(t— At,x )u)=cAt+V(t,x + fAt) (13.176) 
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Tomando-se o mínimo em u, tem-se que 


V(t- Atx) = min J(t — At, x )[u] (13.177) 
= min [At + V(t, x7 + fAt)] (13.178) 


Utilizando a aproximação de primeira ordem na fórmula de Taylor 
V(t, x + fAt) = V(t,x7) + VE (t,x )fAt (13.179) 
e rearranjando-se os termos, obtém-se 
V(t — At, x) — V(t, x) 
At 
que para At | O permite obter a equação de Hamilton-Jacobi-Bellman(HJB) 


= min lec + Ve (t,x) | (13.180) 


—Vit,x) = min lect, u,t) + Vi (t,x) f (x, u, 2] (13.181) 


A condição de contorno pode ser obtida notando que estar em x no instante 
t = ty implica imediatamente no custo cy (x) ,ou seja 


V(t, x) = cy (x) (13.182) 


Observações 


e À equação HJB pode ser expressa em termos do Hamiltoniano: 


—Vi(t,x) = min H(x,u, Vx, t) (13.183) 


e Na equação de HJB a minimização é realizada em relação au € U 


in 4. 13.184 

min {.} ( ) 

enquanto, no problema original, é no espaço de funções admissíveis 
u(t) eu 

in {. 13.185 

min {.} ( ) 


e O problema LQR é um caso particular de controle ótimo e possui grande 
relevância prática. 


O custo é do tipo quadrático, 


eee E x(t T Sx(ty) (13.186) 
Cd = 5 Petr Qx(r) + u(r) Ru()] (13.187) 


e o modelo é linear 
t = Ax + Bu (13.188) 


Apêndices 481 


13.6 Apêndice F - Lema de Barbalat 


No capítulo sobre controle adaptativo, foi utilizada uma função de Lyapunov 
com V negativo semidefinida, de modo que, sem alguma ferramenta adicional, 
não se pode mostrar que o erro de adaptação e(t) > 0 para t > oo. 


Uma ferramenta para remediar essa situação é a utilização do lema de Barba- 
lat, que permite obter uma extensão do método de Lyapunov (Lyapunov like). 


Necessita-se, inicialmente, de um resultado auxiliar, encontrado em livros de 
cálculo tais como o (APOSTOL, 1969). 


13.6.1 Continuidade uniforme 
Assuma que f(t) é diferenciável e a sua derivada é limitada Vt 
jO <M (13.189) 


Entao, pelo teorema do valor médio, 


b) — fla : 
OL =|Ho<M (13.190) 
para algum c € [a,b]. 
De 13.190, tem-se que 
| f(b) — f(a)| < M |b — a| (13.191) 
e, se para um dado € > 0, faz-se 
j= 5 (13.192) 
resulta que para |b — a| < ô 
|f(b) — f(a)| < MŠ <e (13.193) 


13.6.2 Lema de Barbalat 
Seja f(t) € C!a,00) e jim f(t) = a, em que a < oo. Se f(t) é uniformemente 


contínua, então lim f(t) = 0. 
too 


Prova por absurdo: Seja Jim f (t) £ 0. Então Je > 0 e uma sequência mono- 
— 00 


tonicamente crescente {tn} tal que tn — oo à medida que n > 00 e |F(tn)| >E 
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para Vn E N. 


Como f (t) é assumida ser uniformemente contínua, para esse €, Jó > 0 tal que 
Yn e N 


It = tal < 8 = |f(t) — Him] < - (13.194) 
e, portanto, 
Lf] = AE - (F) - #0) (13.195) 
TORORO (13.196) 
> -$ (13.197) 
= - (13.198) 
Como f(t) € C![a, oo), tem-se que 
tn+ô , tn. tn+ô , 
[O foa- f" ioa = [id 
= 1 ao joat 
tn 
tntô 2 
> [ sat 
= = >0 (13.199) 
Por outro lado, , 
[fat = Plta) = Fla) (13.200) 


que permite escrever 


tn +6 i tn. 
dm | [O jod- f Fae] = Jim [lta + 6) — An) 
= |a-al 
0 (13.201) 


Portanto, de 13.199, tem-se que 


tntó , tn . 
/ ioa- f f(t)dt| > 0 (13.202) 
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enquanto, de 13.201, 


[pr f(t)dt — i f(t)dt 


o que é uma contradição. 


=0 (13.203) 
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13.7 Apêndice G - Linearização harmônica 


A linearização harmônica é relevante no estudo de osciladores e existem apli- 
cações interessantes, por exemplo para o desenvolvimento de controladores 
adaptativos com auto-oscilação Self Oscilating Adaptive Systems (SOAS), ava- 
liação da ocorrência de fenômeno do salto (jump phenomenon) e para o ajuste 
de ganhos pelo método de Ziegler-Nichols utilizando oscilação limiar. 


Trata-se de uma técnica baseada em balanceamento harmônico, muito útil no 
projeto de osciladores para obter uma estimativa da frequência e da amplitude 
de oscilação. 

Ressalta-se, inicialmente, que, em geral, o sinal de saída de um dispositivo não 
linear a uma entrada senoidal não é necessariamente senoidal. 

Porém, se o sinal de saída é periódico, pode-se utilizar a série de Fourier e, 
caso o processo tenha característica de filtro “passa-baixa”, pode-se considerar 
apenas a sua primeira harmônica, desprezando-se as harmônicas superiores. 
O método é conhecido, portanto, como o de primeira harmônica (ou do ganho 
equivalente, função descritiva). 


Caso do relé ideal 


Considere o processo G(s) com ordem maior que 2 (mais à frente será visto 
que a ocorrência de oscilação depende da existência de cruzamento das curvas 
de Nyquist com o lugar geométrico dos valores correspondentes ao inverso do 
ganho equivalente), . 


Para ilustrar o procedimento, considere um modelo da forma 


1 
G(s) = Da) (13.204) 


a ser utilizado em malha fechada conforme o arranjo da figura 13.3 
R(s)=0 E(s) 


U(s) 1 Y(s) 
—( > > 
+ o s(s+2)(s+3) | 


Figura 13.3: Exemplo de processo acionado por um elemento liga-desliga 


Para uma forma de onda da entrada senoidal, 


e(t) = E sin (wt) (13.205) 
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ot 


Figura 13.4: Relação entrada-saída de relé simples. 


a saída do relé é dada por 


u(t) “| ey n REA (13.206) 


que é uma onda quadrada apresentada graficamente na figura 13.4. 


A saída (onda quadrada) pode ser representada como uma somatória de harmô- 
nicas pela expansão em série de Fourier 


u(t) = ao + >» an cos (nwt) + sin (nwt) (13.207) 


n=1 


Os coeficientes são determinados através das expressões 


1 27 
ty. E =f u(wt) cos (nwt) d (wt) (13.208) 
0 
1 27 
EE eB f u(t) ain (ud) d (et) (13.209) 
T JO 
Para a onda quadrada de amplitude M, o coeficiente a, é dado por 
2 T 
a = F M cos (wt) d (wt) (13.210) 
0 
2M (7 
= —| cos (wt) d (wt) (13.211) 
T JO 
2M 


— sin (wi) =0 (13.212) 
T 
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Para a onda quadrada de amplitude M, o coeficiente bı é dado por 


= - [OM sin (wt) a0 (13.213) 
- M | sin (ot) d (00) (13.214) 
= a cos (wt) |o (13.215) 
z e (13.216) 
a 


Se o processo G(s) atenua as harmônicas superiores, então é plausível, em 
muitos casos, utilizar a aproximação u(t) = “2 sin(wt) e o fator “4 é deno- 
minado de ganho equivalente do relé. 

Este procedimento é uma versão do princípio de balanceamento de harmônicas 


em que se considera apenas a primeira harmônica. 


O método é aplicável a outros tipos de não linearidades, tais como amplificador 
com saturação, mecanismos com folga de engrenagem, atrito seco, componen- 
tes que exibe resistência negativa em uma faixa de operação, sensores tipo 
u(t) = e(t) e outros, desde que as harmônicas superiores sejam suficiente- 
mente atenuadas pelo processo G(s) 


Então a não linearidade pode ser aproximada for N(E), conhecida como fun- 
ção descritiva, dada por 


Amplitude da 1ºharmônica de u(t) 
N(E) = 13.217 
o Amplitude da senoide de entrada [E] 


Verificação das condições de oscilação 


Para que haja oscilação, jwosc deve ser raiz de 1+ N(F)G(s) = 0, à semelhança 
da condição 1 + KG(s) = 0. 


Aplicando-se essa condição para 


1 
G(s) = ——____ 13.218 
(s) s3 + 382 + 2s ( ) 
tem-se que 
1+N(E) : -0 (13.219) 
(jwose)? F 3(jwosc)? T 2(jwosc) l 
ou 


(jwose)? +3 (jwose) + 2 (jwosc) + N(E) = 0 (13.220) 
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Igualando as partes reais e imaginárias a zero, constata-se que N(E) e w 
satisfazem 


N(E) -3w =0 ; =p oo = 0 (13.221) 


Resolvendo-se esse sistema de equações, resulta que 


w= v2 (13.222) 
2 
N(B)=3(V2) =6 (13.223) 
Uma vez que para o relé ideal 
4M 
N(E) = — (13.224) 
TE 
obtém-se a amplitude do sinal de erro E para, por exemplo, M = 10 
4M 
E — 13.225 
6 ( ) 
~ 2.12 (13.226) 


Exemplo: Oscilador a Diodo Túnel 


Osciladores lineares em que se aloca os polos imaginários puros não são prá- 
ticos, uma vez que a amplitude da oscilação dependerá da condição inicial e 
tenderá a decair ou aumentar, dependendo de se está localizado à esquerda ou 
à direita do eixo imaginário, mesmo que esse desvio seja muito pequeno. 
Uma possibilidade é utilizar um componente que permita injetar energia ao 
circuito quando a oscilação tende a decair, o que pode ser obtido pelo uso de 
componentes com resistência negativa. 


A figura 13.5a apresenta tal circuito empregando um diodo túnel. 


ip [MA] 


Aip 

Reta de 

_ Carga 
4 


al< 


” Pontode 


Operação AV D 


i i 
a 
T ~ 
(c) Característica local 
(a) Circuito (b) Diodo túnel aproximada do diodo 


Utilizando-se as leis de Kirchhoff e transladando-se o eixo de coordenadas em 
torno de ponto de operação (ip, vp) mediante a determinação da reta de carga 
com a característica do diodo túnel, pode-se escrever 
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L{Aiz} 1 Lst+R 
L{Aip} LC 2 + Es+ Ts 


Considere que os parâmetros do circuito são R = 0.59 , C = 0.2 F e L = 0.5 H 
e, com o intuito de simplificar os cálculos e também a apresentação das ideias, 
seja a característica aproximada do diodo túnel conforme apresentado na figura 
13.56. 

Substituindo os valores de R, L e C, bem como os parâmetros que caracterizam 
o gráfico da não linearidade, a condição “1+N(E)G(jwosc) = 0” leva ao sistema 
de equações 


(13.227) 


1+5N(E) = 0 (13.228) 
—w? +10 +5N(E) = 0 (13.229) 
que fornece as soluções wose = 3 e N(E) = —0.2. 


Por outro lado, a função descritiva da não linearidade com resistência negativa 
em uma região, encontrada em vários livros sobre sistemas não lineares, é dada 
por 


Assim, o valor de E tal que N(E) = —0.2 pode ser obtido do gráfico 


Função Descritiva: Diodo Túnel 


Figura 13.6: Função descritiva da característica de resistência negativa, indi- 
cando a amplitude E de oscilação. 
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Oscilador “duro” 


Considere o circuito envolvendo um relé com zona morta, conforme ilustrado 
na figura 13.7. 

Note que, quando o sinal e(t) é pequeno (no exemplo, |e(t)| < 0.1), o relé se 
encontra na região de zona morta e a saída correspondente é 0. 

Porém, se alguma perturbação externa tornar |e(t)| > 0.1, o circuito apresen- 
tará oscilação, como será verificado usando o método da primeira harmônica. 


e| U(s) 1 Y(s) 
> > > 
s(s+1)(s+2) 


R(s)=0 E(s) 
mn | 


+ = 


Figura 13.7: Exemplo de Oscilador “duro”. 


A condição de oscilação é 


1 


que leva à solução wose = V2 e N(E) = 6. 
A figura 13.8 apresenta graficamente o ganho equivalente do relé com zona 


morta. 


Nota-se que N(E) = 6 corresponde a 2 valores de E. Porém, apenas E x 0.41 
corresponde a uma oscilação sustentada, como pode ser concluído por uma 
análise qualitativa simples. 


14 Função Descritiva: Rele com Zona Morta 
r : 


Se Amplitude E aumenta 
Então ganho N(e) decresce 


G7 
= 
6+--@---------@------------------ 
[J 
5 my 1 
4 1 
Oscilação l 
3 Instável 1 
2 i 
I 
1 | y Fasc 0-41 | 
0 0.2 0.4 0.6 0.8 1 


Figura 13.8: Ganho equivalente do relé com zona morta e a solução do exemplo. 
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Caso de não linearidades com memória 


Quando a função não linear apresenta memória, como ocorre com a presença 
de histerese ou de folgas de engrenagem, a saída u conterá componentes tanto 
em sin quanto em cos para uma entrada puramente sin. 


Para mostrar esse conceito, considere a estrutura de controle em que o dispo- 
sitivo liga-desliga é um relé com histerese: 


Figura 13.9: Um processo acionado por um relé com histerese. 


O sinal de saída correspondente a uma entrada senoidal é novamente do tipo 
quadrado, porém, devido à histerese, apresenta uma defasagem não nula 0, 
conforme visto na figura 13.10. 


Figura 13.10: Característica entrada-saída de um relé com histerese. 


Para uma excitação senoidal 


e(t) = E sin (wt) (13.232) 
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e notando que o instante de comutação é dado por 


h 
a tae fee 
9 = sin (5) (13.233) 
os coeficientes da primeira harmônica são 
1 27 
Qi = -f u(t) cos (wt) d (wt) (13.234) 
0 
2 0 T 
- 2? / [= Mices (ui) a (ud i [M] cos 4) dt) (13.235) 
0 o 
4M 
e 
1 27 
Rio na a f senor (13.237) 
T JO 
2 


T 


8 T 

= — Į [—M] sin (wt) d (wt) + 7 [M] sin (wt) d | (13.238) 
0 o 

= a cos (0) (13.239) 


Logo, o sinal u (t) é aproximado por 


u(t) = Sa sin (0) cos (wt) + o cos (O) sin (wt) (13.240) 
= a sin (wt — 0) (13.241) 


Uma vez que a resposta aproximada u(t) é senoidal de frequência w, igual 
à frequência do sinal e(t) de entrada, porém atrasado de O = sin”! (4), a 
função descritiva é 


N(E) = oe (13.242) 
= aes) (13.243) 


2 
4M h h 
= 1 ] à 
TE ( (13.245) 
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Para utilizar a expressão 1+ N(E)JG(s) = 0 ou -NE = G(jw), é interessante 


ter a fórmula para N (E)! 


2 
1 TE h h 

= 1 ) 13.246 

N(E) AM (5) TIF ( ) 

= -| VE? =h? + jh] (13.247) 

4M 
de modo que a parte imaginária é 
1 th 
I = 13.248 
és N(E) AM 


Em vista da presença de memória na linearidade considerada, a função des- 
critiva é complexa. A condição de oscilação é caracterizada por 


= = Ol; 13.249 
NB = SUG) (13.249) 
ou 
T 1 
—— |VE2? -hk?+jh| = = 13.250 
IM | + in| P+ 5+ lexju od 
2 é 
= th (1 — w ) — jw 
VE?2-k?-—j = 13.251 
4M 14M EE ao) 
Igualando as partes imaginárias, tem-se que 
Th —w 
= 13.252 
IM (1 — wy? ra? (13.252) 
Igualando as partes reais, tem-se que 
j= 2 
LPE- = (13.253) 


4M (1 —w?)? + w? 

Inserindo-se os valores dos parametros do exemplo em questao, obtém-se que 
— x 10 

= as = 0.393 (13.254) 
(1—w?)"+w2 4x20 


que leva à frequência de oscilação de w = 1.5 rd/s. Logo, em vista da expressão 


1 — 0.393? 
C/E = É = 0.328 (13.255) 
4M (1 — 0.3932)" + 0.393? 
e em vista de h = 10 e M = 20, obtém-se E = 13.0. 
A solução pode ser obtida graficamente, traçando as curvas de Nyquist e de 


N(Ej +: 


LA “e 
08 A N 
N 
e. an 0.0679 
04 
02 
E Netos 001 
> 
E (-0.328,0.393) 7 
024 / 
th 
04 
4M 0.217 acre 
frequencia em Hz 
os 
w=1.50 rd/s=0.24 Hz \ | / 
os \ / 
N 0.169 / 
Pa 
1 0.13: 
12+ T T T T T T T T 
1.2 1 08 06 04 02 o 0 04 os os 1 1 
Rehin) 


13.7.1 Estabilidade de oscilações 
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Suponha que o método da primeira harmônica indica uma oscilação com am- 


plitude E e frequência w. Uma questão relevante é saber 


se a oscilação é 


estável, ou seja, quando E ou w sofre perturbação, o sistema retorna esponta- 


neamente à condição anterior. 


Se a saída de um oscilador é 


e(t) = E sin (wt) 


(13.256) 


deseja-se verificar se após uma perturbação que alterou a amplitude e a frequên- 


cia para E + AE e w + Aw 
e (t) = (E + AE) sin [(w + Aw) t] e 
o decaimento 7 é tal que 


AE > 0=37n>0 
AE < 0=37<0 


A condição de oscilação 
1 


G (jwo) = “NÆ 


pode ser reescrita agrupando-se os termos reais e complexos 


A(E,w)+jB(E,w) =0 


(13.257) 


(13.258) 
(13.259) 


(13.260) 


(13.261) 
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Notando que sin(0) = Imfe'º) resulta que 


e (t) 


(E + AE) Im (eilotAt) ent (13.262) 


= (E + AE) Im [eletdutintl (13.263) 
a condição A(E,w) + jB(E,w) = 0 se torna 
A(E+AE,w+Av+jmn) +IB(E+ AE,w + Av+jn)=0 (13.264) 


A análise local é feita expandindo-se 4 e B em série de Taylor 


x 
Ca oA OA : 
A(E,w) +5E (E,w) AE + do É (Aw+ jn) (13.265) 
—— ôB OB | 
+IB(E,w) Tide (E,w) AE + Ia, (E,w) (Aw + jn) =0 (13.266) 


em que os termos marcados com x se anulam, levando ao sistema 


aA aA ðB 
gp Eo) AE + zg (Ev) Aw — zg E)n = 0 (13.267) 
A (E, wo) n + “3 (E,w) AE + a (E,w)Aw = 0 (13.268) 


em que Aw pode ser eliminado. 
Logo, tem-se que 


>0 
E 0 £,, 
OA * TƏB É 
| E (Bs) + É (Ea) = (13.269) 
OB OA OA OB 
E (E,w) JE (E,w) — ne (E,w) JE (8.0) AE (13.270) 


As condições AE > 0 > n>0e AE <0 > 7 < 0 permitem escrever a 
condição de Loeb para estabilidade de oscilações 


E dia ae aaa ee | >0 (13.271) 


do (Evo) 35 E”) o do | w) gp Eo) 


Na prática, com estruturas mais simples, pode-se fazer uma análise intui- 
tiva do tipo: “se a amplitude da oscilação aumenta, então o ganho equivalente 
diminui”. 
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13.7.2 Fenômeno do salto 


Um fenômeno típicamente relacionado a modelos não lineares e que é obser- 
vado, às vezes, quando se excita um sistema não linear com um sinal periódico 
é uma mudança abrupta na resposta em frequência. 

Considere o sistema em malha fechada em que existe um ganho com saturação 
e um termo forçante senoidal é aplicado como referência. 


r(t) =R sin(@t) 9 e(t) = E sin(ot+o) 


Figura 13.11: Exemplo de sistema que apresenta um salto abrupto na responsa 
em frequência. 


O ganho equivalente (ou a função descritiva) da função de saturação é 


2 
2M h h h 
N(Eo) = —— Isin! 1 13.272 
(Eo) nE | (ż)ż (x) ( 


Usando o ganho equivalente N(E9) e assumindo-se uma excitação senoidal 
t(t) = Rosin(wt), pode-se escrever a relação entre as amplitudes Ro e Eo 
aplicando o método da função descritiva (ou ganho equivalente) 


Eo 1 
= 13.273 
Ro ~ |14 MEC a 
Substituindo-se i 
Gio) = ——_— 13.274 
Ge) = oy (13.274) 
em 13.273 tem-se que a amplitude Eo deve satisfazer 
R2 
N(Eo) = w? w4) (1+ we — (13.275) 


Ao invés de buscar uma solução fechada, a condição 13.275 será visualizada 
através de um gráfico. 


A figura 13.11 apresenta os gráficos de N( Eo) (13.272) e do termo à esquerda 


de 13.275 para o caso de Ro = 5, M = 10, h = 1, com w variando de 0.450 a 
0.550. 
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Nota-se que, dependendo da frequência w, a solução Eo pode estar associada 
a diferentes segmentos da curva N(E). 


Assim, se a frequência do sinal de excitação for variada, o ponto quiescente 
pode variar abruptamente. 


Única Solução 
para o = 0.550 


/ 


` = y 
fo i o Bm 
Unica Solução DN SR 
para o = 0.450 NAN 


Mudança abrupta de Amplitude 


Figura 13.12: Possíveis valores de Eo para frequências w = 
0.45, 0.475, 0.5, 0.525, 0.55 rd/s. 
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13.8 Apêndice H - Margens de estabilidade LQR/MIMO 


Este apêndice busca complementar o resultado apresentado anteriormente, em 
que se mostrou que o problema LQR leva a uma lei do tipo realimentação de 
estados com margens de ganho de E oo) e margens de fase de +60º, conforme 
mostrado em (LEHTOMAKI, 1981). 


Considere um sistema MIMO com m entradas conforme ilustrado na figura 
13.13, em que cada elemento da matriz perturbação A(s) poderá ser um ganho 
ou um deslocamento de fase, 


a [> GAJ X(s 


Figura 13.13: Realimentação de estados, perturbado por uma matriz diagonal 


A. 


A margem de ganho MIMO é o par de números k e k que define o maior 
intervalo (k, k) tal que a malha fechada segundo a estrutura da figura 13.13 é 
estável se 


k<k<k;i=1,2,...,m (13.276) 


em que 


A margem de fase MIMO é o par de números à e & que define o maior 
intervalo (q, &) tal que a malha fechada segundo a figura mmmm é estável se 


6<6,<¢;i1=1,2,...,m (13.278) 


em que 


A; = exp (jdi) ; ER (13.279) 
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Relação entre os polinômios característicos de malhas aberta e fechada 


Considere um processo a ser controlado através de uma lei tipo realimentação 
estados com a matriz de ganhos K e definam-se os seguintes termos: 


Gr(s) = K(sI—A)'B (13.280) 
cls) = det(sI—A+BK) (13.281) 
o(s) = det(sI— A) (13.282) 


Nessas condições, pela definição, o polinômio característico de malha fechada 
é dado por 


®c(s) = det(sI-A+BK) (13.283) 
= det (st - A)(I+ (sI- A)""BK)| (13.284) 
= det (oI — A)| det la + (sI — A)'BK) | (13.285) 
Necessita-se agora da identidade de Sylvester 


Para a verificação da identidade de Sylvester basta utilizar a propriedade de 
comutatividade 


De fato, de J, tem-se que 


JF Tlel d = JF: 5 | (13.288) 


G I 0 I G I+GF 
= det(I+GF) (13.289) 
e, de IT, 
F I -F] _ I+FG 0 
det | 01 E | G I | = det G I | (13.290) 
= det (I+ FG) (13.291) 


e, portanto, de 13.289 e 13.291, 


det (I + GF) = det (I+ FG) (13.292) 
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a equação 13.285 se torna 


do(s) = det (sI — A) det |I + K(sI — A) !B (13.293) 
VT — e” — eee” 
do(s) G(s) 


Com o auxílio da identidade de Sylvester, o polinômio característico de malha 
fechada é reescrito como 


do(s) 
do(s) 


det(T + Gr(s)) = (13.294) 


Caso Po(s) não possua singularidades no SPD, as singularidades de ®¢(s) 
podem ser estudadas investigando det(I + Gr(s)). 


A matriz I + Gr(s) é conhecida como return difference matriz. 


Margens de ganho e de fase do controle LQR: caso MIMO 


Se G(s) não possuir zeros no SPD e 


o[I+Gi(s))>a;VYweR,a<l (13.295) 
então 
1 1 
MG = ( , ) (13.296) 
ltal-a 


MF = -z sin! (5) Pin”! (5) (13.297) 


Prova: Vide (LEHTOMAKI, 1981). 


Com o intuito de obter o valor de a na condição o [I + Gr(s)| > a, utiliza-se 
a identidade de Kalman 


[E+ Gr Gu)! [1+ Gz (jw)] =14 sci (ju) Gr (jw) (13.298) 


Pela definição de valores singulares, tem-se que 


o? (I+ Gr (jw)] = à; [I+ GË (jw) Gz (jw) (13.299) 
ae” 


N=0 
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Para a matriz N = GÊ (jw) Gz (jw), seja M tal que D = MNM”! é diagonal 


AITHN] = X MM! n MDM" (13.300) 
= X |M +D)M"'] (13.301) 
= AAMA +D] a pu (13.302) 
= ),[[+D] (13.303) 


ou seja, A; = 1 + di, di > 0, permitindo que se escreva 


[oh [I + Gr (jw)] Oi [I de Gy (jw)] (13.304) 


< 
< 1 (13.305) 


Portanto, œ = 1 em 13.296 e 13.297, resulta que 


1 1 
ee a ey 13. 
Ea Oe io SO) 
e 
1 \ 4 
-9 sin”! (5) = 60"<6<60º=2sin! (5) (13.308) 


para à = 1,2,...,m. 
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13.9 Apêndice I - Dinâmica zero 
A linearização por realimentação da saída de um modelo de grau relativo r 


x = f(x) +g(x)u (13.309) 

y = h(x) (13.310) 
pode levar a uma representação em que n — r componentes do vetor estado, 
doravante denotados w,41, Wr+2,--. , Wn nao são observáveis. 


Para se investigar a natureza de Wr+1, Wr+2, -.. , Wn, considere o sistema LTI 
de ordem 3, descrito por 


0 1 0 0 
x = 0 0 1 |[x+|0lu (13.311) 
a31 —4a32 —433 1 


y = E 0]x (13.312) 


Conforme o processo apresentado de linearização por realimentação da saída, 
deriva-se y, 


Es (13.313) 
= Cx 
0 
0 
= [aoollo o 1 |x+[ao O fu 
a31 —@32 —433 1 
= [00 |x (13.314) 


Derivando-se mais uma vez, 


0 
j= [0a | 0 0 1 x+[0 a o ||0 Ju 
a31 a32 433 1 
= | —C€2031 —C2as2 C1 — C2433 ] T+ cou (13.315) 
e, se co £ 0, então o grau relativo é r = 2. 
Por outro lado, a partir de G(s) 
N 
Gis) = MW = RA (13.316) 


D(s) 83 + a338? + a328 + a31 
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Usando a identidade polinomial 


D(s) = Q(s)N(s) + R(s) (13.317) 


em que os graus de D(s), Q(s), N(s) e R(s) são 3, 2, 1 e 0, respectivamente, 


obtém-se as expressões para os coeficientes 


1 
oO = — 
ca 
a1 = -5 (C2033 gi) 
G 
= tes 2 
q = (ci — asscico + a32€9) 
2 
3 2 2 3 
To = Bia + a3gC{C2 — a32C1C5 + a3165) 
2 


Em termos dos polinômios Q(s), R(s) e 
N(s), a função de transferência G(s) pode 
ser representada conforme a figura 13.14. 


_ N(s) 
8) = gnt) sa (13318) 
1 
= IO no (13319) 


Nessa representação, a malha fica carac- 
terizada por 


Figura 13.14: Representação 
modificada de G(s). 


O a2 (13.320) 
W(s) = Neo) (13.321) 
E(s) = U(s)—W(s) (13.322) 
De Y(s) = aa Els), tem-se que 
Y(s) [aos + Hs + g] = E(s) (13.323) 


ou 


e = gyt+anyt ay (13.324) 
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Fazendo-se a associação z1 = ye z2 = Ñ, 
à = f= (13.325) 
a = qe y yt+—e (13.326) 


e de W(s) = mY (s) verifica-se que 


1. Se N(s) tiver raízes no semiplano direito (G(s) de fase não minima), 


então a será um modelo instável (eventualmente w(t) pode crescer 


indefinidamente) 
2. A saída y(t) excita o componente w(t). 
Em vista da expressão e = u — w, 


q q2 1 


TE gees (13.327) 
go qo qo 
los 
= -g at- ay +u- u] (13.328) 


Usando o controle 


z 
u = | q qn | | : + w — qov (13.329) 
obtém-se 
Zl = 29 (13.330) 
ig = v (13.331) 
wb = -2w+roy (13.332) 
aq 
y = ma (13.333) 


A representação do exemplo de 3º ordem em 13.316 possui agora uma parte 
na forma de Brunovsky e uma componente w que não é observável. 

O modelo dessa parte não observável possui como polo o zero de G(s). 

No caso não linear a parte não observável é da forma z = y(z,w) e, para z = 0, 
o fluxo de 2 = y(0, w) é chamado de dinâmica zero e, por semelhança ao caso 
LTI, diz-se que o sistema é de fase mínima se 2 = (0, w) for assintoticamente 
estável. 
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13.10 Apêndice J - Não linearidades setoriais 


Muitas vezes uma função ganho f(y) assume um valor em um intervalo [kz, ku], 
e no plano (f(y),y) o seu gráfico pode ser interpretado como pertencente a 
um setor, como ilustrado na figura 13.15. 

Este Apêndice foi incluído porque há vários casos em que modelos lineares são 
atuados através de ganhos que se situam em um setor. 


Um exemplo típico é quando se utiliza um controlador fuzzy. 


Considere um modelo SISO-LTI G(s) a ser realimentado através de uma fun- 
ção estática não linear f : R > R, tal que é f (£) > 0, como visto na figura 
13.15. 


f(E)a ky 


Figura 13.15: Realimentação com uma função de ganho contido em um setor. 


O problema de Lur'e-Postnikov consiste no estudo da estabilidade da origem 
0 de um sistema com entrada nula e com um bloco não linear f(y) na malha. 


A não linearidade f(y) é assumida ser do tipo setor kr e ky (L de lower e U 
de upper). 


Uma realização mínima de 
G(s)=cT(sI-A)!b+4d (13.334) 
é representada por Anxn, Dax1, Cnx1 € dix1- 


x = Ax+bu (13.335) 
y = elx+du (13.336) 


em que, conforme o diagrama de blocos em 13.15, 


u = — f(y) (13.337) 


Conjecturas de Aizerman e de Kalman 


Se f = ky, então, muitas vezes, é possível encontrar valores kz e ky, de modo 
que, para Vk € (kz, ky), o sistema em malha fechada é estável. 
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Na tentativa de se estender essa condição para o caso de f não linear, surgiram 
as conjecturas de Aizerman e de Kalman. 


A conjectura de Aizerman se refere à estabilidade do sistema em questão se 


kr < + < ky (13.338) 


e a de Kalman 


kr < < ky e kg < — < ky (13.339) 


dy 
Infelizmente, ambas as conjecturas são falsas uma vez que existem contrae- 


xemplos (vide, por exemplo, (NARENDRA; TAYLOR, 1973)). 


Para obter condições de estabilidade para não linearidades contidas em um 
setor (kz, ku), adotam-se algumas hipóteses adicionais. 


fly) df 
y 


e (A,b) é controlável 


e (A,c) é observável 


Re{\(A)} <0 


1+kyd>0 


kz = 0, sem perda de generalidade, pois o caso kr 4 0 pode ser conver- 
tido de modo simples. 


Assumindo, por enquanto, que existe uma matriz P > O adequada, toma-se a 
função candidata de Lyapunov, V(x) = x” Px. Mais adiante será apresentada 
uma condição tal que garante a positividade de P. 


T mE 
V = x Px+x Px (13.340) 
(x7A7 + ub") Px +x! P (Ax + bu) (13.341) 
= x!(A’P + PA)x + 2x! Pbu (13.342) 

Por outro lado, 

y = clx+du (13.343) 
c'xtdu-y = 0 (13.344) 
cxu + du? — yu = 0 (13.345) 
cTxkyu + dkyu? — kuyu = 0 (13.346) 
cTxkyu + dkyu? — kyyu +u? — u? = 0 (13.347) 
xTckyu + (1+ kyd) u? — (u + kyy)u = 0 (13.348) 
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O termo x? ckyu+(1 + kyd) u? — (u + kyy) u = 0 será subtraído na expressão 
V = xT (ATP + PA)x + 2x Pbu (13.349) 


resultando em 


V = x’(A’P + PA)x 4+ 2x! Pbu — 
0 
ro O10 ICON 
—x! ckyu — (1 — kyd) u? + (u + kyy) u (13.350) 
x? (ATP + PA)x + 2x” (Pb = bue) u — (1 + kyd) u? + 
+ (u + kyy) u (13.351) 
O último termo à direita dessa expressão é negativo, pois para u = — f(y) 
(u + kuy) u = — (- f(y) + kuy) f(y) < 0 (13.352) 


haja vista que 


>0 quando f(y) >0 


(ov so) d id ande FC) 0 (13.353) 


Necessita-se, agora, do auxílio do lema de Kalman-Yakubovich-Popov (KYP) 
para reescrever a expressão de V em uma forma mais conveniente (para uma 
prova simplificada do Lema KYP, ver RANTZER, A. On the Kalman-Yakubovich- 
Popov lemma. Systems and Control Letters, v. 28, p. 7-10, 1996). 


Lema de Kalman-Yakubovich-Popov 


Fornecidas uma constante y > 0, uma matriz Anxn cujos autovalores possuem 
a parte real estritamente negativa, uma matriz Lpxn > 0 e vetores bnx1 € Vnx1, 


se 
Re{T(jw)} >0, Vw ER (13.354) 
em que 
T(s) =v? (sI— A) Ib+ > (13.355) 
então Je > 0, qnx1 € Pnxn > 0, tal que 
ATP+PA = -qq' -eL (13.356) 
Pb-v = \yq (13.357) 
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Associa-se, inicialmente, os dois primeiros termos da direita da expressão 
de V com aqueles que estão no lema de Kalman-Yakubovich, 


ATP4+PA +» A’P+PA (13.358) 
1 
Pb-okve «+ Pb—v (13.359) 
ou seja, i 
5kue=v (13.360) 
Escolhendo-se para y 
y=1+ kud (13.361) 
a expressão para T (s) se torna 
T(s) = vT(sI-A)Ib+ > (13.362) 
1 
= 5kue™(sI— A) 'b+ > (13.363) 
1 
= 5 [ive (st — jp +9] (13.364) 
1 
= 5 [kve? (sl = A) Tb + 1+ kud] (13.365) 
1 
= 5 i + ky (c”(s1 — AJtb+ d)| (13.366) 
1 
ae [1 + ky G(s)] (13.367) 
Portanto, a condição Re{T(jw)} > 0 se reduz a 
Re{1 + kuG(jw)} >0, Yw € R (13.368) 


Satisfeita essa condição, o Lema de KYP garante a existência de e > 0, Qnx1 
e Pnxn > 0, e permite reescrever V 


3 1 
V = x’(A?P+PA)x + 2x? (pb — tve) u— (1 + kyd) u? + 


+ (u + kyy) u (13.369) 
= xT(-qq! — cL)x + 2x? V1 + kydqu — (1 + kyd) u? + 
+ (u + kyy) u (13.370) 
2 
= -ex?Lx— (x"q — v1+ kudu) + (u+ kyy) u (13.371) 
< —exTLx (13.372) 
<ù (13.373) 


estabelecendo a estabilidade da malha fechada. 
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Resumindo o desenvolvimento apresentado, tem-se que, para o problema de 
Lur'e-Postnikov com o processo modelado por G(s) = c7 (sI — A)! b +d em 
que 


e Re{rA{A}} <0 
e (A,b) controlável 
e (A,c) observável 
el+kyd>0 
e kr = O (sem perda de generalidade) 
tem-se estabilidade da malha fechada se 
Re{1+kyG(jw)} >0, ;VweR, (13.374) 


Caso kr #0 


Reorganiza-se o diagrama de blocos conforme a figura 13.16 e definindo G(s) 
e ganho f. 


Figura 13.16: Rearranjo do diagrama de blocos para o caso de ky 0. 


Tem-se agora que 


G(s) = So (13.375) 


f E setor(0, ky — kz) (13.376) 
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13.11 Apêndice K - Otimização numérica 


Métodos de otimização numérica são amplamente utilizados no projeto de con- 
troladores, por exemplo, no ajuste de ganhos de um controlador PID, projeto 
de filtros e otimização de trajetórias entre outras aplicações relevantes. 


Aqui são apresentados alguns dos métodos mais simples baseados em direções 
de decréscimo das funções custo. 


Métodos baseados em população como os algoritmos genéticos, enxame de par- 
tículas e os bio-inspirados não são tratados aqui, mas podem ser encontrados, 
por exemplo, em (HADDAD; SOLGI; LOAICIGA, 2017). 


Um excelente texto em língua portuguesa para um estudo mais aprofundado 
no tema apresentado aqui é (IZMAILOV; SOLODOV, 2005). 


13.11.1 Otimização univariada 


Trata-se do caso simples em que a grandeza a ser otimizada O € R, ou seja, o 
problema é obter 0* tal que 


0* = arg minJ (0) (13.377) 


Busca por secção áurea 


A secção áurea divide um segmento L em duas partes e a secção áurea de cada 
uma dessas partes possui um ponto em comum com a secção anterior. 

Uma possibilidade para busca em um 

intervalo delimitado por escolhas ini- É 

ciais O min € Omar é utilizar bi-secção, al (Leh 


obtendo 01,2. a BL E 
4 E a SS pe L 
Porém, pode ocorrer que apesar de q BL all) > Bi ala 


J(Omin) > J(Omaz) O ponto de mí- 
nimo esteja contido em | min: 01,5 |. Figura 13.17: Relações entre os seg- 
mentos particionados pela secção áu- 


i ae: . rea. 
Esse risco diminui se forem determi- 


nados 2 pontos ao invés de 1, o que 
pode ser feito com o uso da secção áurea. 


Se o intervalo [ Onin; Omaz | fosse dividido em 3 partes, resultando os pontos 
intermediários 01/3 we 99/3, ter-se-ia que calcular J em 2 pontos (J(01/3) e 
J (82/3). 

Utilizando a secção áurea, em vista da propriedade de que a secção de cada 
uma das partes obtidas possui um ponto em comum com a secção anterior, 
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necessita-se determinar J(0) apenas 1 vez a cada iteração. 


Diretamente da figura, obtém-se o sistema de equações a = 82 e 8 = 8º+a(1— 
a) que possui a solução a = (3 — v5)/2 ~ 0.382 e 8 = (v5 — 1)/2 ~ 0,618. 


Minimização utilizando secção áurea 


Passo 0: Propor valores para tol e Nmax % (tolerância em 0 e número máximo 
de iterações) 

Passo 1: Arbitrar valores Omin € Omax % (assumindo que J é convexa no in- 
tervalo [Omin, Omax|) 


Passo 2: Fazer k = 0, renomear ok. = Omin € of = Onax 


Passo 3: Obter os dois pontos 0! e ok, por secção áurea de [0E, ok] 


Passo 4: Calcular J(0%), J(6*,), 
Je ja J(0%) RO) 


Passo 5: Enquanto | gh — okt! | > 
tol ou k < Nmax : % (início do laço) 
Passo 6: Se J(08) < J(0k;) Então 
flag = E Senão flag = D 


Passo 7: Escolha do intervalo à Es- 
querda ou à Direita: Se flag = E 
Então obter OEH! e okt! por secção 
áurea de [0%, 0k,], fazer Op = 04, e eo 
calcular J(0**1) Se flag = D Então 


obter OF +1 e gr por secção áurea __ i p 
de [0,0%], fazer Og = 0E, e calcular Figura 13.18: Mecanismo de iteração 
mo bi m 


k+1 na otimização utilizando a secção áu- 
JOR”) A 


Dr 
E 

B 

D 
§ 


Passo 8: k := k + 1 e retornar % (fe- 
cha o laço) 


Passo 9: 0 = 0%, 


E interessante notar que a cada iteração é necessário calcular apenas 1 valor 
J(Onovo, O que pode ser importante se, por exemplo, esse valor é obtido por 
simulação numérica. 


Ajuste de um polinômio quadrático 
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A partir de um ponto 99 e um passo h (0) 
dado, pode-se fazer uma busca como 
ilustrada na figura 13.19 (Obs: pode 
não funcionar para valores elevados 


de h) | 
Passo 0: Escolher 09 eh; k = 0 - : 


vo 


Passo 1: Obter o ponto 0441 = 0k+h 


Passo 2: Se J(0z41) < J = Ok +h Figura 13.19: Busca inicial para o algo- 
e fazer h = 2h; k = k +1; re- ritmo de ajuste de polinômio quadrá- 
torna ao Passo 3. Senão h = —h tico. 


Passo 3: Escolher os 3 pontos com o 
menor valor de J: {J(0x41), J(Ox), J(0x-1), J(Ox_2) } 


Passo 4: Colocar esses 3 pontos na forma de pares ordenados (04, J(04)), 
(08, J(©g)) e (Oc, J(9c)). Se esses três pontos não estão alinhados, então é 
possível “passar” uma parábola por eles (ou seja, é possível obter um polinô- 
mio quadrático cujo gráfico passa por esses três pontos). 


Em outras palavras, a expressão da parábola J(0) = a0? + bO + c seria tal que 


J(04) = aB4+bOA+C (13.378) 
J(0B) = a0b+bOp+c (13.379) 
J(00) = ai +boc+c (13.380) 


Passo 5: O mínimo de J ocorre aproximadamente em 0 = -È 


Observação: Para a aplicação em vista, não são necessários 04, Op e dc 
genéricos, mas sim apenas o caso de Os igualmente espaçados de h. Mais 
especificamente, 04 = 0 — h, 0, = 0,00 =O+A. 


Assumindo que h £ 0, o sistema de equações se reduz para 


J(04) = a(@—h)?+0(0—h) +c (13.381) 
J(0g) = a0?+b0+c¢ (13.382) 
J(8c) = a(0 +h) +b(0+h) +c (13.383) 


que deve ser resolvido em termos de (a, b, c). 
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Para o caso particular O = 0, obtém-se resolvendo o sistema de equações que 


à E zya (J(04) — 23(95) + J(8c)) (13.384) 
= ~ 5, ((84) — J(80)) (13.385) 
E = JO) (13.386) 


O ponto estacionário de J(0) = a0? + bO + c é obtido fazendo 


dJ 

o = 13. 

T|, 0 (13.387) 
2a0*+b = 0 (13.388) 


e, se a > 0, então 9* será o ponto de mínimo de J(0). 
Portanto, 


gt a (13.389) 


2a 
e substituindo-se os valores de a,b e c, tem-se 


1 J(94) — J(80) 


os J(04) — 2J(06) + J(8c) 


(13.390) 


Lembrando que Og = 0 e que havia sido assumido 0 para simplificar os cálculos, 
o ponto de mínimo original é 


o 1 J(04) — J (8c) 
Pme 5! a SIC 


(13.391) 


Algoritmo usando aproximação quadrática 


Utilizando-se a ideia de aproximar a 
função de custo J, por uma quadrá- 
tica, pode-se propor o seguinte algo- 
ritmo iterativo: 

Passo 0: Arbitrar 89 e h. Fazer k = 0 
Passo 1: Se J(0o +h) > J(90) Então 
h:=—h 


(sentido inicial incorreto) 


vo 


Passo 2: 0,41 = 0, +h Figura 13.20: Ajuste de uma quadrá- 
tica 
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Passo 3: Se J(0,11) < J(04) Então 
h := 2h e retorna ao Passo 2 Senão 
h= —h/2 e Ok+2 = 0k41 +h 


Passo 4: Escolher entre (0). 1,04, Ok+1, 0k+2) OS 3 associados aos menores va- 
lores de J. Renomear esses 3 de {04, 0g, 0c} 


Passo 5: O ponto de mínimo aproximado é 


1 J(04) — J(8c) 

0* = 0g 4 13.392 
2 2 (04) —2J(05) + J(0c) RE 

Relação entre o gradiente e a curva de nível 

Considere o ponto 9* e um deslocamento h. 

Segundo a fórmula de Taylor 

J(0*+h) = J(0*)+VJI7(6*)h (13.393) 
J(0*+h)—J(0*) = <VJT(0*)|h> (13.394) 


ATO) = [VII] Ih] cos(4{7 J7 (8), h} 


Logo, para um deslocamento h a partir de 0*, a variação AJ(0*) é máxima se 
VJT(9*) || h. Ou seja, VJ7(0*) aponta na direção de maior crescimento de 


Além disso, se o deslocamento h é tal que VJT(0*) 1 h corresponde a 
AJ(0*) = 0 na vizinhança de 0*. Portanto, VJT(9*) é perpendicular à curva 
de nível de J. 


Algoritmo de máxima declividade 


O algoritmo da máxima declividade (Steepest Descent) faz buscas na direção 
oposta àquela indicada pelo gradiente. 

Passo 0: Escolher tol e Nmar % (tolerância em O e número máximo de itera- 
ções); arbitrar Oo e fazer k = 0 


Passo 1: Seja hy := -VJT (04) 

Passo 2: Obter \* que minimiza J(A) := J(O, + Ahy);% (Otimização em 1 
variável real À) 

Passo 3: Fazer 0,41 = Ok + Nhpek:=k+1 

Passo 4: Se |v 77 (em) < tol ou Se k > Nmaz Então 0* = Ok 

Passo 5: Se k > Nmaz Então mensagem de falha 


Passo 6: Retornar ao passo 2 
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Curvas de 
Nível de J 


Ponto de 
Minimo 


Observações: 

No passo 2, utiliza-se hy := —D;,VJ"(0;) que modifica a direção de busca. 
No caso especial de D = H-!(0,.) em que H(0,) := ESA é a matriz Hes- 
siana, tem-se o método de Newton. 


O método de Newton possui velocidade de convergência maior que o da ma- 
xima declividade. 


Em vista de possíveis dificuldades em obter as segundas derivadas, requeridas 
em H(0,), e também devido à necessidade de inversão de matriz H~!(0;), 
existem vários métodos que buscam obter aproximações de H(9,) (ver, por 
exemplo, (LUENBERGER, 1979) e (POLAK, 1971). 


No passo 3, não é necessário obter A* que minimiza J(A), mas sim um A* tal 


que J(A*) < J(0;). Um regra para obter tal A* é o de Armijo. 


Regra de Armijo 


A proposta da regra de Armijo é buscar um 
intervalo de À tal que J(X) < J(0), ou seja, 
ao invés de buscar um ponto de mínimo, 
aceita-se um ponto que reduz J. 


(0) + eT OA 
/ 


Observando-se a figura 13.21, 


JO) < F(0) + eF"(0)d (13.395) [to Ne Be 
KO) + To). 


com € € (0,1) (o apóstrofo em J'(0) denota 
derivada). Figura 13.21: Redução de J 


A partir de Ag > 0 que satisfaz J(A) < J(0)+ usando a regra de Armijo 
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eJ'(O)A, toma-se Ap +1 = aAg com a > 1, (ou 
o método menos “agressivo” Aķ+1 = Ax +AA) até que haja “piora”: 
aaa) > (0) + EF (0) Apa (13.396) 


Nesse ponto, adota-se À* = Ap. 


13.11.2 Otimização no R” 


Em muitos problemas de otimização paramétrica, O € R” como o caso do con- 
trolador PID (0 = [ Kp, Kr, Kp)). 

Apenas para ilustração, apresenta-se aqui o método de Nelder-Mead (ou de po- 
liedros flexíveis), embora existam muitos outros algoritmos (vide, por exemplo, 
(LUENBERGER, 2010), IZMAILOV; SOLODOV, 2005), (HIMMELBLAU, 
1972)). 


Algoritmo dos poliedros flexíveis 


Trata-se de um algoritmo muito utilizado por não requer a determinação de 
VJ. 


Nelder, J. A.; Mead, R. A simplex method for function minimization. Com- 
puter Journal. v. 7, n. 4, p. 308-313, 1965. doi:10.1093/comjnl/7.4.308 


Passo 0: Escolher tol, Nmax, bem como parâmetros a > 0,0 < 8 <1,y > 
e0 < p< 1 % (reflexão, contração, expansão e redução, respectivamente) e 
fazer k = 1 

Passo 1: Se J: R” — R, escolher n + 1 pontos {0;,02,--- , On+1} não alinha- 
dos 


Passo 2: Determinar quais são os vértices com maior e menor valor de J 
associado 


ea UL ) ( 
I — i 4 1 . 


Passo 3: Obter as coordenadas do baricentro Opg da face oposta a Oy : 


1 n+l 
Onc =- | X 0: -0y (13.399) 
i=1 


n 


Passo 4: Reflexão: Refletir o “pior vértice”através da face oposta a este 


Og := OR := Ogc +a (0gc — 0H) (13.400) 
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| 


Vértice com Ponto = 
Minimo 


o maior J(9) 


Baricentro da 0, 
Face Oposta 0 


Figura 13.22: Exemplo de progressão no método dos poliedros flexíveis 


Passo 5: Redução: Se J(0r) > J(0H) Então 0; =: 0, + p (0; — 01) % (manter 
Oz e aproximar os demais 0; de 07) 

Passo 6: Contração: Se J(0r) > J(0;) VO; 4 Oy Então Oy := Oc+8 (Oy — 8c) 
Passo 7: Expansão para aumentar a velocidade de progressão 0p: 

Se J(0r) < J(0pc) Então Op := Ogc + y (Or — 0H) 


Se J(0z) < J(0pc) Então Op := Og % (Elimina Oy e Opg é um novo vértice) 
Se J(0z) > J(90pc) Então Op := Or % (Elimina Oy e Or é um novo vértice) 
Passo 7: k:=k+1 

Passo 8: Se 5! ||0; — OL|] > tol e k < Nmax retornar ao passo 2. 

Esse algoritmo também é conhecido como o de Nelder-Mead, Simplex e Amo- 


eba. Notar, porém, que Simplex é o nome de um algoritmo de programação 
linear. 


Método da função de penalidade 


Considere o problema de minimizar J(9) sujeito à restrição g(8) = 0 ou g(0) < 
0. 


Esse problema pode ser reescrito na forma de minimização sem restrições do 
custo 

F 2 

J(8) = J(9) + M ||g(0)|| (13.401) 


O termo | g(0) | representa uma penalidade por violar g(0) = 0 e para M > 
oo, a solução do problema irrestrito J pode se aproximar do problema original 
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com restrições. 


Um enfoque alternativo é o da barreira que se utiliza 
J(e) = J(0) + M B(8) (13.402) 
sendo frequentemente utilizada a função 
B(®) = [max (0, g(8)}]? (13.403) 


Se O estiver fora da região viável, B(0) impõe um custo adicional, donde o 
nome “barreira”. 


Condição de Kuhn-Tucker 


Para verificar se um dado ponto O é ótimo, necessita-se de algum critério como 


o de Kuhn-Tucker. 


Considere o problema de minimização 


i 13.404 
min J (8) (13.404) 
sujeito às restrições lineares 
g(8) < (13.405) 
g2 (0) < (13.406) 
gm(8) < O (13.407) 


Uma restrição tal que g; (0) = 0 é dita estar ativa. 


Em um ponto 0* candidato a solução deve 
ser tal que não é possível obter uma dire- 
ção h de decréscimo J(©* +h) < J(9*) e, 


simultaneamente, manter as restrições ativas 


Curva de Nivel 


Jativas(9* + h) <0. de 9,(0) 


q 


As direções h de decréscimo de J devem es- 
tar a menos de 90° de —V.J(0*. 

Para ilustrar graficamente a condição de 
Kuhn-Tucker, sejam apenas 2 restrições ati- 
vas gı (9*) e gə (0*) em um certo ponto 0*. 


Curvas de Nível 
Curva de Nível 


de 9,(8) 


>. . ., Figura 13.23: Condição de 
Pela figura, —V J (6*) é uma combinação li- pn Tucker. 


near de Vgı (8*) e Vga (0*) : 
-V J (9) = A Var (0%) + A2V go (8º) (13.408) 
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Seja h um deslocamento a partir de 9* e note que, pela fórmula de Taylor, 
J(0* +h) = J(0*) + AT VI(O*) (13.409) 
No caso, 
J(8* +h) © J(8*) = A? [Vai (9%) + AV go (8*)| (13.410) 
ou 
J(9* +h) — J(0*) = —Ar(h*|Vgi (0*)) — Av(h™|Vgo (0*)) (13.411) 


Para que 0* + h não viole as restrições ativas gı (0*) e gə (0*), deve-se ter, 
simultaneamente, (AT |V gr (0%) > 0 e (h7|Vgo (0%) > 0. 


Se h for uma direção tal que J(9* + h) — J(8*) < 0 e de 


J(8* +h) — J(80*) = A (bP |V ga (8*)) — Ao th” IV 9o (8*)) (13.412) 
es Ne, eer Ve mm 
<0 >0 >0 


conclui-se que À > 0 e Ag > 0 no ponto de ótimo com as restrições gı e 92 
ativas. 
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Ate 
Esta obra busca oferecer aos estudantes e profissionais da area de Sistemas e 
Controle uma visão ampla, moderna e integrada do tema de modo simples, po- 
rém sem prescindir de rigor formal. São apresentados os aspectos práticos rele- 
vantes na prática com uma sólida base teórica que permite aprofundar o domínio 
dos conceitos envolvidos. Cada tópico é ilustrado com exemplos numéricos e 
complementados com exercícios de variadas dificuldades. Alguns detalhes mais 
intrincados das ferramentas utilizadas nos projetos de controladores podem ser 
encontrados na forma de apêndices. 
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